- 博客(24)
- 收藏
- 关注
原创 读文献先读图:小提琴图怎么看?
小提琴图(Violin Plot),是一种集成了箱线图和核密度图特征的数据可视化图形,用于展示多组数据的分布情况和概率密度。1.显示数据分布:小提琴图能够清晰地展示数据的分布情况,包括数据的中位数、四分位数、离群值等统计信息。通过小提琴形状的宽度和高度,可以直观地比较不同组或条件下数据的分布差异。3.异常值检测:在小提琴图中,可以观察到小提琴外部的离散数据点,这些数据点往往表示数据中的异常值。2.比较多组数据:将不同基因在不同组织中的表达水平用小提琴图展示,以便研究它们的表达模式是否有显著差异。
2025-04-24 16:32:46
273
原创 读文献先读图:韦恩图怎么看?
韦恩图是一种用于展示集合之间关系的图表工具,它由一系列相互交叠的圆组成,每个圆代表一个集合。这些圆有重叠的部分,用于表示两个或更多个集合之间的共同元素。图中的非重叠部分则表示各个集合的独立元素。
2025-04-21 17:28:58
207
原创 读文献先读图:火山图怎么看?
火山图(Volcano plot)是散点图的一种,它将统计测试中的统计显著性量度(如p-value)和变化幅度相结合,从而能够帮助快速直观地识别那些变化幅度较大且具有统计学意义的数据点(代谢物等)。是一种单变量统计分析方法,常应用于研究基因组、转录组、代谢组、蛋白质组等数据分析
2025-04-21 17:08:08
355
原创 读文献先读图:气泡图怎么看?
富集分析是指与所有鉴定到的目标代谢物、蛋白质、基因背景相比,差异代谢物、蛋白质、基因中显著富集到的功能条目,从而给出差异代谢物、蛋白质、基因与哪些生物学功能显著相关。富集气泡图是其中一种展现形式,适用于各种功能性数据库,常用的有GO数据库、KEGG数据库、COG/KOG数据库等。可从不同的方面了解代谢物、蛋白质、基因参与的生理功能、结构特征、亚细胞位置等,进而揭示代谢物、蛋白质、基因在各个生命活动中的生物学意义。
2025-04-03 16:32:04
331
原创 KEGG、GO 各种富集分析结果一文看懂
富集分析是指与所有鉴定到的目标代谢物、蛋白质、基因背景相比,差异代谢物、蛋白质、基因中显著富集到的功能条目,从而给出差异代谢物、蛋白质、基因与哪些生物学功能显著相关。富集气泡图是其中一种展现形式,适用于各种功能性数据库,常用的有GO数据库、KEGG数据库、COG/KOG数据库等。可从不同的方面了解代谢物、蛋白质、基因参与的生理功能、结构特征、亚细胞位置等,进而揭示代谢物、蛋白质、基因在各个生命活动中的生物学意义。
2025-03-28 17:08:21
2950
原创 R语言绘图:小提琴图
小提琴图(Violin Plot),是一种集成了箱线图和核密度图特征的数据可视化图形,用于展示多组数据的分布情况和概率密度。今天就给大家分享一下如何用R语言绘制小提琴图
2025-03-19 16:49:44
1164
原创 R语言绘图:韦恩图
韦恩分析(Venn Analysis)常用于可视化不同数据集之间的交集和并集。维恩图(Venn diagram),也叫文氏图、温氏图、韦恩图、范氏图,用于显示元素集合重叠区域的关系型图表,通过图形与图形之间的层叠关系,来反应数据集之间的相交关系。在 R 语言中,进行韦恩分析(Venn图绘制)可以通过多个不同的包来实现,常用的包括 VennDiagram、venn 和 ggVenn 等。本文案使用ggVenn软件包进行分析。
2025-03-05 16:11:36
988
原创 NHANES数据库样本中的权重分析
Nhanes的数据是有权重的,不能用常规的统计方法进行分析,那要怎么分析呢?今天喵学姐就来给大家讲一讲Nhanes数据的权重分析。
2024-12-18 17:24:36
2802
原创 读文献先读图:热图怎么看?
热图是一种以颜色的变化来表示数据矩阵或数据集中程度的图表工具。通过颜色的深浅来表示数值的大小,颜色越深表示数值越大,颜色越浅表示数值越小。在生物信息学中,热图常用于展示基因表达、蛋白质相互作用、代谢途径活性等方面的数据信息。例如,在基因表达研究中,热图可以展示同一基因在不同组中的表达水平,通过色阶变化显示表达量高低。能够直观地展示数据的分布情况,发现数据之间的关联性,并突出显示具有显著特征的数据点。
2024-10-12 17:17:56
1621
原创 322本生信友好期刊,附生信文章发文量、最新影响因子和中科院分区!
喵学姐一般是建议补一点细胞实验(PCR、WB),当然纯生信也是有期刊愿意收的(如果时间紧迫想要尽快发表,最好还是能加点实验现在非常欢迎干湿结合的文章)SCI收录查询:https://mjl.clarivate.com/home。期刊诚信风险指数:https://www.jcarindex.com/选刊的时候记得检查期刊是否还在SCI收录以及期刊诚信风险指数。2024年了,纯生信越来越难投了。
2024-09-23 17:09:57
2382
原创 你的稿件状态改变了么?投稿状态知多少,只看这一篇就够了
经历千重万难之后我们终于把一篇SCI写完啦,是不是觉得到这里就可以松一口气了?NONONO,成稿之后我们还要面临投稿,面临期刊长时间的审稿。而作为学术「守门员」的期刊编辑和同行评审专家需要对稿件进行多轮审稿,需要很长时间来完成这一工作。对于第一次投SCI的小白来说,投稿的阶段才是最煎熬最磨人心态的,那么投稿到期刊后我么你的稿件一共会经历哪些呢?今天喵学姐就带大家来了解一下期刊投稿的12种稿件状态
2024-09-12 15:13:03
3580
原创 你了解基因表达调控的六大关键元件吗?一文看懂
在生物学中,基因表达是一个复杂而精细的过程,涉及多个调控元件的协同作用。这些元件包括启动子、终止子、内含子、外显子、增强子和沉默子,它们共同参与了基因表达的精细调控,确保细胞在不同状态下能够正确地表达所需的蛋白质。那么这些元件你都区分清楚了吗?
2024-08-29 16:22:29
3056
原创 中科院1区高分SCI,网药+多组学+临床数据,这思路太好抄了!
今天给大家分享一篇网药的文章,都说网药不好发,只能说是你的思路不够好。看看这篇文章,内容丰富程度以及逻辑的清晰度令人佩服,不仅用上了网药、多组学,还结合了NHANES的临床数据
2024-08-29 16:18:38
1138
原创 用一张图,理清肿瘤转移机制
肿瘤转移(tumor metastasis)是指肿瘤细胞脱离原发生长部位,通过各种途径的转运,在机体内远离原发部分的器官/组织继续增殖生长,形成同样性质肿瘤(转移瘤)的过程。在原发部位生长的肿瘤称为原发瘤(primary tumor),在远隔部位生长的肿瘤成为转移瘤(matastatic tumor)。
2024-08-14 17:01:25
764
原创 高分生信套路,免疫预后模型结合临床样本验证
喵学姐又来啦,今天带大家来看一篇肿瘤生信常规的免疫相关预测模型套路(虽然文章比较早了)。这篇文章使用从5个数据库收集的乳腺癌患者的数据构建免疫评分模型,并评估了免疫评分模型与预后,化疗和临床特征之间的关系。
2024-08-14 11:42:59
1940
原创 IF5.6分,哈尔滨医科大学团队生信文章:代谢相关基因预测指标预测预后卵巢癌的免疫治疗反应和候选药物
纯生信不好发了?那是你不够卷了。今天喵学姐就带大家看看这篇1月份的生信文章,通过代谢相关基因,用常规分析套路构建预后模型,就发到了一区5分+(共一还是本科生)
2024-06-27 10:53:21
2839
3
原创 全网最全的医学公共数据库,不用做实验就能发论文!
对医生来说,临床太忙,每天在医院里连轴转,没法做实验,也没有时间收集临床数据,又想发与自己科室相关、临床研究类的sci。为什么有些医生的sci发得那么顺利?其实,发表论文并不难,手握多篇sci的临床医生,发表论文也有诀窍:充分利用临床数据库。利用公共数据库写论文,已经成为毕业、升职称、年度绩效考核的重要方法。现在有很多国际权威的临床数据库,这些平台的数据都是鼓励科研人员去挖掘数据、做科学研究的。这些数据库的数据来源可靠,样本量大。
2024-04-02 17:18:55
4266
1
原创 IF4.5分,南京医科大学利用NHANES数据库构建中风风险预测模型,太好发文了!
经常有小伙伴私信说在临床上收集数据难,没有文章又没办法毕业/晋升。其实想发文章并不是一定要自己收集数据呀。现在有很多国际权威的临床数据库,这些平台的数据都是鼓励科研人员去挖掘数据、做科学研究的。近两年,NHANES数据库越来越热门,利用NHANES数据库发表的文章也越来越多:
2024-03-29 17:40:41
1717
1
原创 如何查询基因和通路的相关性,确定研究思路
那如果我们后续要做一些富集分析,可以把相关系数阈值灵活调整,如设置为0.4,筛出8000多个基因,我们可以选取前100个基因进行后续的富集分析。通过这些方法,大家会发现要了解基因和通路的关系也并不复杂,除了看文献,花点时间在数据库查询,也能获得不少有价值的数据,更为后续的分析、实验设计做了基础。很多小伙伴私信喵学姐,说设计课题、设计实验的时候,找不到思路,有目标基因但是又无法确定相关的通路。在我们获得基因之后,就可以看一下他们之间的互作关系,我们可以把获得的所有基因以及目标基因,统一
2024-03-13 17:38:11
6242
原创 7.3分生信,胶质母细胞瘤+铜死亡热点+分型结合实验验证,构建铜死亡相关预后模型
胶质母细胞瘤(Glioblastoma, GBM):根据传统的组织病理学特征,胶质瘤可被分为WHOⅠ-Ⅳ型。GBM属于胶质瘤中WHOⅣ型,其是最具侵袭性的胶质瘤。铜死亡(Cuproptosis)是一种新型的程序性细胞死亡形式,其不同于细胞凋亡、焦亡和铁死亡。有研究表明,在铜凋亡过程中,Cu2+与线粒体呼吸链中三羧酸循环的硫辛酰化组分结合,导致硫辛酰化蛋白聚集和铁硫簇蛋白下调,随后发生蛋白毒性应激和细胞死亡。
2024-02-29 17:19:49
1012
原创 通过4个步骤,入门生物信息学分析
二十一世纪是生物的世纪,该观点已提出多年。甚至有人提出,这句话的真正含义应该是“二十一世纪在各行各业都能找到曾经学生物的人”。对此,我们不再做进一步推敲。但可以看出的是,越来越多人已经投身于生物相关研究了。还不问问自己,是不是快成了那个掉队宝宝啦?
2024-01-05 20:30:00
10295
1
原创 差异基因分析怎么做?最简单的火山图做法,一秒学会
火山图(Volcano plot)是散点图的一种,它将统计测试中的统计显著性量度(如p-value)和变化幅度相结合,从而能够帮助快速直观地识别那些变化幅度较大且具有统计学意义的数据点(代谢物等)。是一种单变量统计分析方法,常应用于研究基因组、转录组、代谢组、蛋白质组等数据分析。
2024-01-04 17:16:08
12484
2
原创 超级全能的生信分析数据库——GSCA
GSCA(Gene Set Cancer Analysis)是一个涵盖单基因分析、多基因分析、免疫浸润分析、突变分析以及药物敏感性分析的交叉式综合性癌症分析数据库,其中包含了涵盖了来自TCGA和GDSC的33种不同类型的癌症数据。除此之外,该网站还将基因数据与临床信息和750多种小分子药物密切结合,这为挖掘候选生物标志物和有潜在价值的小分子药物提供了重要支持,有助于更好地设计实验并为进一步的临床试验提供指导。
2024-01-03 14:05:25
2473
1
原创 保姆级NHANES数据库使用教程
National Health and Nutrition Examination Survey (NHANES数据库,网址:https://www.cdc.gov/nchs/nhanes/index.htm),收集了有关美国家庭人口健康和营养信息,是一项基于人群的横断面调查。该数据库开始于80年代,生物样本包含了参与者的血清,血浆,尿液等,涉及多种测量指标。此外,还包含了大量的调查问卷数据,调查问卷涉及广泛,包括人口统计学、社会经济学、饮食和健康相关问题,体检部分包括生理测量、实验室检查等内容。
2023-12-20 18:30:00
25014
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人