R包的尽头是 C/C++

该博客介绍了如何利用C/C++编写R包,以kaori为例,这是一个用于统计fastq文件中barcode数量的工具,允许指定最多错配次数。kaori依赖Zlib库进行压缩。博主分享了如何调用C/C++代码来构建R包,以及学习CMake和C++编程的相关资源。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

疑似 singleR 包的作者的github

  • https://github.com/LTLA?page=2&tab=repositories

他主要使用的语言是 C/R/C++.

R包的尽头是C/C++

barcode counting lib in C++

  • https://github.com/LTLA/kaori
  • https://ltla.github.io/kaori/

这个包是统计 fastq 文件中 barcode 的数量的。
可以指定最多错配个数。
压缩依赖 Zlib 库。

帮助页面: https://ltla.github.io/kaori/

有待测试:

  • 如何调用C/C++代码写R包(.C()和.Call()接口 ): https://zhuanlan.zhihu.com/p/525648754
  • 还需要了解 CMake: https://github.com/Kitware/CMake
  • 学习 C++ 笔记: https://blog.csdn.net/wangjunliang/article/details/126533710

R data.table 主要是C

  • https://github.com/Rdatatable/data.table

李恒 的C代码

李恒的博客中提到,R和python大概比C/C++慢50倍,除非找到其他高效语言写的库,否则,用C/C++一分钟的需要一个小时,一个小时的需要浪费两天。
另一个问题是python的部署问题,很容易包冲突。而C/C++可以编译为不依赖的二进制文件,方便用户使用。

如果拿枪指着脑袋,非要选一个语言推荐,大神推荐内存安全的语言Rust,因为Linux内核也用了,Google和MS Azure甚至白宫也在推。
缺点:Rust学习曲线太陡峭!
但是,看起来的C,用到不经常出现 segmentation fault 也需要好几年的练习。而现代C++和C十分不同,它是一个添加了大量现代特性的巨兽+塞了数十年历史代码的最复杂语言。掌握C++需要更多努力。
如果不需要内存安全,只需要快速,Go也是第二个选择。
其他语言,要么太小众,要么设计不好,要么只在工业界使用(Swift, C#),都可以自己尝试,但不推荐给计算生物学家。
大神自己短期内不转Rust,还继续使用 C。

  • C++之父的网站: https://www.stroustrup.com/quotes.html

c++读书笔记

  • https://dawneve.github.io/learnCpp/#/
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值