疑似 singleR 包的作者的github
- https://github.com/LTLA?page=2&tab=repositories
他主要使用的语言是 C/R/C++.
R包的尽头是C/C++
barcode counting lib in C++
- https://github.com/LTLA/kaori
- https://ltla.github.io/kaori/
这个包是统计 fastq 文件中 barcode 的数量的。
可以指定最多错配个数。
压缩依赖 Zlib 库。
帮助页面: https://ltla.github.io/kaori/
有待测试:
- 如何调用C/C++代码写R包(.C()和.Call()接口 ): https://zhuanlan.zhihu.com/p/525648754
- 还需要了解 CMake: https://github.com/Kitware/CMake
- 学习 C++ 笔记: https://blog.csdn.net/wangjunliang/article/details/126533710
R data.table 主要是C
- https://github.com/Rdatatable/data.table
李恒 的C代码
- bioawk 博客,另一个博客
- bioawk 源码@github
- 李恒的博客 2014-2022,主要是C语言
李恒的博客中提到,R和python大概比C/C++慢50倍,除非找到其他高效语言写的库,否则,用C/C++一分钟的需要一个小时,一个小时的需要浪费两天。
另一个问题是python的部署问题,很容易包冲突。而C/C++可以编译为不依赖的二进制文件,方便用户使用。
如果拿枪指着脑袋,非要选一个语言推荐,大神推荐内存安全的语言Rust,因为Linux内核也用了,Google和MS Azure甚至白宫也在推。
缺点:Rust学习曲线太陡峭!
但是,看起来的C,用到不经常出现 segmentation fault 也需要好几年的练习。而现代C++和C十分不同,它是一个添加了大量现代特性的巨兽+塞了数十年历史代码的最复杂语言。掌握C++需要更多努力。
如果不需要内存安全,只需要快速,Go也是第二个选择。
其他语言,要么太小众,要么设计不好,要么只在工业界使用(Swift, C#),都可以自己尝试,但不推荐给计算生物学家。
大神自己短期内不转Rust,还继续使用 C。
- C++之父的网站: https://www.stroustrup.com/quotes.html
c++读书笔记
- https://dawneve.github.io/learnCpp/#/