- 博客(3)
- 收藏
- 关注
原创 R语言 下载KEGG数据库中通路的基因集
成功后安装KEGGREST,版本我先填入3.10,如果发生错误的话会提示一个正确的版本号,重新填入即可。在library这个包的时候,提示缺少Biostrings,所以再安装一个包,如果不缺少可以跳过。2. 安装R包BiocManager、KEGGREST。1.首先去KEGG官网查找自己所需要的通路的编号。这里我需要的是hsa05244通路,记住这个编号。3. 提取通路中的基因,并保存到csv文件中。library KEGGREST这个包。
2025-02-10 11:31:08
395
原创 论文阅读:scBERT as a large-scale pretrained deep language model for cell type annotation of single-cell
受数据样本量小、人工干预多、过度依赖 marker gene(已报道的特异性基因)等因素的影响,单细胞测序细胞类型注释技术一直面临着泛化性、可解释性、稳定性均比较低的问题,现存的算法难以有更广泛的应用。随机选择来自Zheng68K数据集的10%、30%、50%、70%和90%的PBMC细胞作为用于微调的参考,而剩余的作为用于测试的查询样本。预测结果,真实分类对比,用人肝组织评估未知细胞类型鉴定,MacParland数据集,4种类型,每次从中取出一种类型进行,用于验证,其他用于训练。
2023-08-01 15:51:36
628
1
原创 R语言网络社团划分可视化及可信度
生成1000个和最大社团相同节点数和密度的随机网络,计算这1000个随机网络的聚类系数的概率密度分布,拟合整正态分布,并计算其95%的置信区间,检验我们划分的社团的聚类系数落在哪个区间,来确认是否划分结果是否可靠。我在这里使用的邻接表,以csv格式存储,读取数据将格式转为图,这里g就是转换过来的图。到此,就完成了社团划分,和最大社团的可视化,现在对最大社团进行可信度分析。这里使用R语言中的igraph进行社团划分和可视化。首先要找到最大的社团,我这又引用了sqldf包。
2023-03-06 10:22:13
1077
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人