自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 R语言 下载KEGG数据库中通路的基因集

成功后安装KEGGREST,版本我先填入3.10,如果发生错误的话会提示一个正确的版本号,重新填入即可。在library这个包的时候,提示缺少Biostrings,所以再安装一个包,如果不缺少可以跳过。2. 安装R包BiocManager、KEGGREST。1.首先去KEGG官网查找自己所需要的通路的编号。这里我需要的是hsa05244通路,记住这个编号。3. 提取通路中的基因,并保存到csv文件中。library KEGGREST这个包。

2025-02-10 11:31:08 395

原创 论文阅读:scBERT as a large-scale pretrained deep language model for cell type annotation of single-cell

受数据样本量小、人工干预多、过度依赖 marker gene(已报道的特异性基因)等因素的影响,单细胞测序细胞类型注释技术一直面临着泛化性、可解释性、稳定性均比较低的问题,现存的算法难以有更广泛的应用。随机选择来自Zheng68K数据集的10%、30%、50%、70%和90%的PBMC细胞作为用于微调的参考,而剩余的作为用于测试的查询样本。预测结果,真实分类对比,用人肝组织评估未知细胞类型鉴定,MacParland数据集,4种类型,每次从中取出一种类型进行,用于验证,其他用于训练。

2023-08-01 15:51:36 628 1

原创 R语言网络社团划分可视化及可信度

生成1000个和最大社团相同节点数和密度的随机网络,计算这1000个随机网络的聚类系数的概率密度分布,拟合整正态分布,并计算其95%的置信区间,检验我们划分的社团的聚类系数落在哪个区间,来确认是否划分结果是否可靠。我在这里使用的邻接表,以csv格式存储,读取数据将格式转为图,这里g就是转换过来的图。到此,就完成了社团划分,和最大社团的可视化,现在对最大社团进行可信度分析。这里使用R语言中的igraph进行社团划分和可视化。首先要找到最大的社团,我这又引用了sqldf包。

2023-03-06 10:22:13 1077 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除