- 博客(349)
- 资源 (4)
- 收藏
- 关注

原创 2021.07.30【WGS/GWAS】丨全基因组分析全流程(上)
目录摘要命令行三级目录摘要时隔半年,终于把WGS前面的分析用snakemake搭建好了。读者不要嫌我慢,确实是项目不多,流程也不算特别复杂。之前的shell脚本也能用,因此迟迟没有真正搭建。现在项目慢慢多了,考虑到提升工作效率,趁着前几天做了2个WGS的项目,把这个流程梳理出来。命令行#vim: set syntax=python#__author__ = "Yang Xin"#__copyright__ = "Copyright 2021, Wang lab"#__email__ = "4
2021-07-30 17:05:54
4785
5

原创 2020.11.9【WGS/GWAS】丨全基因组分析(关联分析)全流程(下)
经过为期半个月的~~东拼西凑~~ 研发测试,作者终于整理出了一个从VCF开始的GWAS后期分析流程。当然要感谢很多大佬提供的~~代码~~ 帮助,在文章中也附上参考链接。对GWAS还不够熟悉的朋友,可以看一下我之前整理的一份PPT学习笔记[《遗传进化与GWAS研究》](https://blog.csdn.net/yangl7/article/details/108486232)。
2020-11-09 14:36:28
18236
10
原创 2025.04.25【Heatmap】热图绘制技巧与参数解析
热图是一种数据可视化技术,它通过颜色的变化来表示数据的大小或密度。在生物信息学中,热图常用于展示基因表达数据、蛋白质相互作用网络等。每个单元格的颜色深浅代表了相应数据点的数值大小。# 自定义颜色方案。
2025-04-25 10:41:29
792
原创 2025.04.24【3D】3D绘图入门指南
3D绘图是一种数据可视化技术,它通过在三维空间中展示数据点来提供更丰富的视觉信息。这种技术可以帮助我们理解数据的深度和层次结构,尤其是在处理复杂的生物信息学数据时。我们可以通过调整视图参数来自定义图表的视角。# 自定义视图在这个例子中,view3d函数用于调整视图参数。theta和phi参数用于设置视角的角度,fov参数用于设置视场角,zoom参数用于设置缩放级别。
2025-04-24 17:13:35
630
原创 2025.04.23【探索工具】| STEMNET:高效数据排序与可视化的新利器
在生物信息学领域,分析和处理大规模数据集是研究者们面临的日常挑战。STEMNET工具应运而生,旨在提供一个强大的平台,用于探索和分析单细胞RNA测序(scRNA-seq)数据。这一工具的核心价值在于其能够揭示细胞状态的异质性和动态变化,从而为研究人员提供深入的生物学见解。STEMNET通过结合多种算法和数据可视化技术,使得复杂的数据分析流程变得简洁而高效。STEMNET的核心功能:STEMNET能够对单细胞数据进行排序,揭示细胞状态的异质性和动态变化。
2025-04-23 11:11:06
896
原创 2025.04.23【Treemap】树状图数据可视化指南
Treemap 的一个强大之处在于它的可定制性。我们可以调整颜色、标签和其他视觉元素来增强图形的信息表达能力。
2025-04-23 11:04:43
966
原创 2025.04.22【Sankey】流图分析技巧与应用
networkD3包提供了多种选项来自定义Sankey图的外观,包括节点的颜色、宽度、字体大小等。# 自定义节点颜色# 更新Sankey图# 打印更新后的Sankey图这段代码将为每个节点设置不同的颜色,使图表更加直观和易于理解。
2025-04-22 15:52:16
757
原创 2025.04.21【Cartogram】| Cartogram制图流程
Cartogram是一种地图制图技术,它通过改变地图上区域的大小来反映某个变量的数值大小。这种技术使得地图不仅仅是地理位置的展示,更是数据信息的直观表达。在生物信息学中,我们经常需要分析和展示不同地区的生物标记物分布情况,Cartogram提供了一种有效的视觉工具。cartogram包还允许我们自定义Cartogram的外观。例如,我们可以设置颜色、添加标题等。# 自定义颜色和标题main = "生物标记物浓度分布")
2025-04-21 14:18:56
1311
原创 2025.04.20【Lollipop】| Lollipop图绘制命令简介
Lollipop图是一种将条形图转换为线条和点的图表,用于展示数值型和分类型变量之间的关系。这种图表在生物信息学中特别有用,因为它可以清晰地展示基因表达水平与特定条件或组别之间的关系。在R语言中,我们可以通过多种方式创建Lollipop图,每种方法都有其特定的代码实现。本文将介绍几种不同的R代码示例,帮助你理解Lollipop图的构建过程,并提供实际的代码,以便你能够将这些图表应用到自己的生物信息学数据分析中。通过这些示例,你将学习如何调整Lollipop图的样式,以及如何根据数据的特点选择合适的图表类型。
2025-04-21 14:17:42
500
原创 2025.04.19【Chord diagram】| 弦图绘制技巧大全
弦图是一种用于展示实体间相互关系的图形表示方法。它将一组实体(节点)排列在一个圆周上,并通过连接这些节点的弧线(链接)来展示它们之间的流动或关系。这种图形特别适合于展示循环数据或者网络数据中的连接关系。接下来,我们将学习如何自定义弦图的外观,包括节点的颜色、标签、弧线的宽度等。# 自定义节点的颜色和标签在这个例子中,我们为每个节点指定了不同的颜色,并添加了标签。
2025-04-19 23:11:48
861
原创 2025.04.19【Spider】| 蜘蛛图绘制技巧精解
Spider/Radar图表是一种特殊的图表类型,它通过从中心点向外延伸的轴来展示多个变量的数据。每个轴代表一个变量,而数据点则沿着这些轴绘制。这种图表特别适合于展示一组变量的相对重要性或比较不同个体或组在多个维度上的表现。fmsb库允许你自定义Spider/Radar图表的许多方面,包括轴的标签、颜色、图例等。你可以通过修改pcol和pfcol。
2025-04-19 23:11:14
1183
原创 2025.04.18【数据修复】DCA:高效缺失值插补工具解析
在生物信息学领域,数据分析是一个复杂且耗时的过程。DCA(Differential Correlation Analysis)工具是一个专门设计来识别和分析差异相关性的统计工具。它能够帮助研究者从大量的生物医学数据中,发现变量间的相关性变化,这对于理解复杂疾病的分子机制至关重要。DCA工具通过计算和比较不同样本或条件下变量间的相关性,揭示了数据背后的生物学意义。DCA工具的工作原理DCA工具的工作原理基于统计学中的相关性分析,通过计算变量间的相关系数来衡量它们之间的线性关系。
2025-04-18 10:40:57
927
原创 2025.04.18|【Map】地图绘图技巧全解
通过上述步骤,我们学习了如何在R语言中使用不同的地图样式来创建静态和交互式地图。这些地图样式在生物信息学中尤其有用,可以帮助我们理解基因表达、疾病分布、物种多样性等数据的空间模式。希望这篇文章能够帮助你快速上手R语言的地图绘制功能,将复杂的空间数据转化为直观的地图可视化,从而更深入地分析和解释生物信息数据。如果您觉得这篇文章对您有所帮助,或者激发了您对生物信息学的兴趣,我诚挚地邀请您:🔔 关注我的账号,不错过每一次知识的分享和探索的旅程。
2025-04-18 10:39:24
1184
原创 2025.04.17【Stacked area】| 生信数据可视化:堆叠区域图深度解析
堆叠面积图是一种非常适合展示随时间变化的数据的图表类型。它通过将不同群体的数据堆叠在一起,使得我们可以同时观察到总体趋势和各个群体的贡献。这种图表类型在展示多个变量随时间变化时特别有用,因为它可以清晰地展示每个变量对总体的贡献。
2025-04-17 21:21:33
1052
原创 2025.04.17【Dendrogram】生信数据可视化:Dendrogram图表详解
树状图(Dendrogram)是一种树形结构的图表,用于展示层次聚类的结果。在这种图中,每个节点代表一个数据点或数据点的集合,而分支则表示这些数据点之间的相似性或距离。通过调整不同的参数和方法,可以生成不同样式的树状图,以更好地揭示数据的层次结构和聚类信息。我们可以自定义树状图的样式,例如改变颜色、添加标签等。plot(dend, main = "自定义样式的树状图")这里我们添加了物种标签,并设置了分支的颜色为蓝色。
2025-04-17 21:10:01
1416
原创 2025.04.16【GroupedandStackedbarplot】生信数据可视化技法
通过掌握堆叠条形图和分组条形图的绘制方法,我们可以更有效地传达我们的研究成果。例如,堆叠条形图适用于展示总量和各部分的分布,而分组条形图适用于比较不同子组之间的数值差异。📚 我承诺,将持续为您带来深度与广度兼具的生物信息学内容,让我们一起在知识的海洋中遨游,发现更多未知的奇迹。:为图表添加必要的注释和标签,以便观众可以快速理解图表的内容和含义。🔔 关注我的账号,不错过每一次知识的分享和探索的旅程。
2025-04-17 21:09:23
1232
原创 2025.04.15【Connection】| 生信数据可视化:连接图绘制指南
连接地图是一种数据可视化技术,用于展示不同地理位置之间的连接关系。在生物信息学中,这种地图可以用来展示不同样本或数据点之间的空间关系,例如,不同地区的疾病爆发点、物种分布等。连接地图通过绘制大圆航线来表示两点间的最短路径,这种航线是球面上两点间的最短路径,因此在地图上呈现为圆润的线条。你可以通过调整ggplot2。
2025-04-15 08:33:41
1087
原创 2025.04.15【技术探索】| ZINB-WaVE:降维与归一化的模拟分析利器
在生物信息学领域,特别是在单细胞RNA测序(scRNA-seq)数据分析中,ZINB-WaVE工具以其独特的优势而备受关注。ZINB-WaVE是一种零膨胀负二项模型(ZINB)的变体,它专门设计用于处理单细胞数据中的稀疏性问题。这种稀疏性表现为大量的零值,这在传统的统计模型中往往被忽视。ZINB-WaVE通过引入额外的零膨胀参数来解决这一问题,从而更准确地模拟和分析scRNA-seq数据。该工具的开发,为研究人员提供了一种强大的方法来识别和解释单细胞实验中的基因表达模式。
2025-04-15 08:31:51
1031
原创 2025.04.14【Table】| 生信数据表图技巧
通过上述内容,我们学习了如何在R语言中使用不同的包来创建和操作表格。从基础的数据框操作到高级的交互式和动态表格,R语言提供了强大的工具来满足各种数据可视化需求。希望这篇文章能帮助你更好地理解和应用R语言在生物信息学数据可视化中的强大功能。如果您觉得这篇文章对您有所帮助,或者激发了您对生物信息学的兴趣,我诚挚地邀请您:🔔 关注我的账号,不错过每一次知识的分享和探索的旅程。📚 我承诺,将持续为您带来深度与广度兼具的生物信息学内容,让我们一起在知识的海洋中遨游,发现更多未知的奇迹。
2025-04-14 08:35:08
1301
原创 2025.04.14【Animation】| 动画式生信数据可视化
总结来说,这些备忘单是生物信息学绘图方法的宝贵资源,它们不仅提供了详细的代码示例,还涵盖了从基础到高级的各种技巧,是学习R绘图不可或缺的工具。这些工具不仅提供了详细的代码示例,还涵盖了从基础到高级的各种技巧,是学习R绘图不可或缺的资源。在生物信息学中,动画可以帮助我们观察数据随时间的变化,或者展示复杂的动态过程。📚 我承诺,将持续为您带来深度与广度兼具的生物信息学内容,让我们一起在知识的海洋中遨游,发现更多未知的奇迹。在生物信息学中,动画可以帮助我们观察数据随时间的变化,或者展示复杂的动态过程。
2025-04-14 08:33:24
1011
原创 2024.04.14【数据科学新视角】| PHATE:革命性的降维与可视化工具
在生物信息学领域,我们经常面临一个挑战:如何处理和理解高维度的数据。这些数据通常包含成千上万的特征,直接分析这些数据不仅困难而且容易出错。为了解决这个问题,我们引入了PHATE(Potential of Heat-diffusion for Affinity-based Transition Embedding)工具,这是一种革命性的降维和可视化工具,专门设计来处理高维生物数据。PHATE是一个强大的工具,可以帮助您理解和可视化高维生物数据。通过上述步骤,您可以轻松地将PHATE集成到您的数据分析工作流中。
2025-04-14 08:31:27
901
原创 2025.04.13【Density 2d】| 基因表达数据可视化
的内容,2D密度图有多种类型,每种都有其特定的用途和视觉效果。在生物信息学中,2D密度图是一种非常有用的工具,可以帮助我们理解基因表达数据中的复杂关系。通过使用不同的绘图包和函数,我们可以创建不同类型的2D密度图来展示数据的不同方面。通过对2D空间中特定区域内观测值的数量进行计数,并用颜色梯度来表示,我们可以直观地观察数据的分布和密度。📚 我承诺,将持续为您带来深度与广度兼具的生物信息学内容,让我们一起在知识的海洋中遨游,发现更多未知的奇迹。的内容,2D密度图有多种类型,每种都有其特定的用途和视觉效果。
2025-04-13 14:46:30
1125
原创 2025.04.13【技术分享】| scIB:单细胞数据整合的利器
在生物信息学领域,单细胞RNA测序(scRNA-seq)技术的发展极大地推动了我们对细胞异质性的理解。这项技术允许研究者在单个细胞水平上分析基因表达,揭示了细胞群体中前所未见的多样性和复杂性。然而,不同实验条件、技术平台或批次效应可能导致数据的不一致性,这对于跨数据集的比较和集成分析构成了挑战。scIB工具应运而生,旨在通过先进的算法减轻这些批次效应,从而实现不同单细胞数据集之间的有效整合。scIB通过归一化和批次校正步骤,提供了一种稳健的方法来对齐来自不同来源的单细胞数据,为进一步的分析打下坚实的基础。
2025-04-13 08:33:25
732
原创 2025.04.13【数据洞察】| RCA:革命性的聚类分析与可视化工具
在生物信息学领域,数据的分析和处理是揭示生物数据内在模式的关键。RCA(Residue Contact Analysis)工具正是在这样的背景下应运而生,它是一种专门用于分析蛋白质残基间相互作用的工具。通过计算和可视化蛋白质结构中的残基接触图,RCA帮助研究者理解蛋白质的三维结构和功能。这种分析对于理解蛋白质如何折叠、如何与其他分子相互作用以及它们的动态变化至关重要。
2025-04-13 08:31:34
887
原创 2025.04.12【技术分享】| Demuxlet:高效处理UMIs和变异检测的利器
Demuxlet是一款专门用于处理Unique Molecular Identifiers(UMIs)的软件,它能够从混合的测序数据中准确分离出不同微生物的DNA序列。UMIs是一种用于区分PCR扩增过程中产生的重复序列的技术,这对于准确识别和量化样本中的微生物种类至关重要。Demuxlet是一款强大的工具,可以帮助研究者高效地处理UMIs和变异检测。通过掌握Demuxlet的基本命令和高级应用,研究者可以根据不同的需求灵活调整分析流程,以获得最佳的分析结果。
2025-04-12 08:34:11
857
原创 2025.04.12【生物信息学新工具】| SPADE:高效聚类与降维分析的利器
在生物信息学领域,尤其是基因表达数据的分析中,单细胞RNA测序(scRNA-seq)技术的发展带来了海量数据的处理需求。SPADE(Single-Cell Data Integration and Differential Expression)工具正是为了应对这一挑战而设计的。SPADE是一个用于单细胞RNA-seq数据的预处理、集成和差异表达分析的R包,它通过整合多个数据集,提高数据的解析度,并识别出在不同条件下表达差异显著的基因。
2025-04-12 08:31:48
606
原创 2025.04.11【数据科学新工具】| scMCA:单细胞数据分类与可视化的革命
在单细胞分析领域,scMCA(single-cell Multi-Cell-type Analysis)工具以其强大的功能和灵活性脱颖而出。scMCA是一个专为单细胞数据设计的分析工具,它能够处理和分析来自不同细胞类型的大规模数据集。这个工具的核心价值在于其能够揭示细胞间的相互作用和通讯网络,这对于理解复杂的生物系统和疾病机制至关重要。单细胞测序技术(Single-Cell Sequencing, SCS)近年来取得了迅猛发展,它允许我们从单个细胞水平上解析基因表达模式,揭示细胞异质性。
2025-04-11 08:33:35
877
原创 2025.04.11【数据分析新视角】| SoupX:量化分析与可视化的利器
在生物信息学领域,处理高通量测序数据是一项挑战,而SoupX工具正是为了应对这一挑战而设计的。SoupX是一个基于Python的分析工具,专门用于处理单细胞RNA测序数据中的无细胞mRNA。它通过精确的量化和去除无细胞mRNA,帮助研究人员更准确地解析细胞信号,从而深入理解复杂的生物系统。
2025-04-11 08:31:40
999
原创 2025.04.10【工具分享】| DropletUtils:高效UMI质量控制与模拟工具解析
在单细胞测序技术迅猛发展的今天,DropletUtils工具以其高效、灵活的特性,成为了生物信息学领域中不可或缺的数据分析利器。该工具专为处理单细胞测序数据中的液滴(droplet)信息而设计,能够处理和分析由10X Genomics平台生成的数据。DropletUtils通过提供一系列功能强大的接口,使得研究人员能够轻松地从复杂的单细胞数据中提取有价值的生物学信息。
2025-04-10 08:33:57
1279
原创 2025.04.10【深度学习应用】| scLVM:单细胞数据的细胞周期分析与可视化工具
在生物信息学领域,单细胞RNA测序(single-cell RNA-seq)技术的发展为研究细胞异质性提供了前所未有的机会。scLVM,即单细胞Latent Variable Model,是一个建模框架,专门用于分析单细胞RNA-seq数据。它能够将观察到的异质性分解为不同的来源,从而允许对混杂变异源进行校正。这一工具的核心在于其能够识别和区分技术变异和生物学变异,进而提供更准确的细胞状态和过程的推断。scLVM通过建模单细胞数据中的技术变异和生物学变异,帮助我们更深入地理解细胞的异质性。
2025-04-10 08:31:53
1259
原创 2025.04.09【研究前沿】| DPT:探索表达模式、排序与可视化的新境界
开启探索DPT工具的旅程,首先需要了解DPT(滑动离散周期变换)的基本概念。DPT是一种先进的信号处理技术,特别适用于分析生理信号,如脉搏血氧仪采集的光电容积脉搏波(PPG)信号。与传统的傅里叶变换相比,DPT利用正弦基函数进行周期域分析,能够有效地处理随机噪声和非平稳数据。这种算法在MATLAB®中实现,结合了自相关与系综平均,为生物信号分析提供了一种强大的工具。DPT,全称为滑动离散周期变换(Sliding Discrete Periodic Transform),是一种用于分析周期性信号的数学工具。
2025-04-09 08:34:09
667
原创 2025.04.09【数据科学新工具】| LIGER:一站式多维数据整合与可视化解决方案
在生物信息学领域,单细胞测序技术(Single-Cell Sequencing, SCS)的兴起为研究者提供了前所未有的细胞层面的基因表达数据。这项技术使得我们能够深入探究细胞异质性,揭示细胞状态和功能。然而,随着数据量的增加,如何有效整合来自不同实验的数据成为了一个挑战。
2025-04-09 08:31:56
576
原创 2025.04.08【技术分享】| bseqsc:一站式解决差异表达分析、数据整合与可视化挑战
在生物信息学领域,基因表达分析是一个核心任务,它帮助我们理解基因如何在不同条件下发挥作用。bseqsc工具便是这样一个强大的分析工具,专门设计用于单细胞RNA测序数据的基因表达差异分析。它不仅能够识别出在不同样本或条件下表达量有显著差异的基因,还能揭示这些差异背后的生物学意义。bseqsc工具的优势在于其能够处理大规模的单细胞数据,并且提供了一个用户友好的界面来执行复杂的生物信息学分析。用户可以通过简单的命令行操作来完成从数据预处理到差异表达分析,再到结果可视化的整个流程。
2025-04-08 08:34:30
693
原创 2025.04.08【工具探索】| SC3:交互式聚类分析的新纪元
在生物信息学领域,数据的复杂性和高维度对分析工具提出了严峻挑战。SC3(Seurat Clustering v3)工具应运而生,它是一种专为单细胞RNA测序数据设计的聚类分析工具,能够处理大规模数据集并提供精确的聚类结果。SC3的核心优势在于其能够识别细胞间的细微差异,这对于理解细胞异质性和生物学过程至关重要。
2025-04-08 08:32:06
911
原创 2025.04.07【数据科学新工具】| dynverse:数据标准化、排序、模拟与可视化的综合解决方案
在生物信息学领域,数据的复杂性和分析的需求不断增长,这促使了工具和资源的不断涌现。Dynverse,作为一个新兴的工具集,应运而生,旨在简化和加速生物信息学分析流程。它通过集成多种算法和方法,为用户提供了一个统一的平台,以处理和分析复杂的生物数据。Dynverse的核心优势在于其模块化设计,允许研究人员根据具体需求选择合适的工具,从而提高工作效率并降低技术门槛。这种灵活性使得Dynverse不仅适用于生物信息学的专业人士,也适合初学者和跨学科的研究人员。模块化设计。
2025-04-07 08:33:39
992
原创 2025.04.07【基因网络探索】| Nichenet:基因网络可视化工具解析
NicheNet是一个基于R语言的生物信息学工具,它允许用户通过图形界面或命令行界面来分析和可视化基因网络。这个工具的核心在于其能够利用机器学习方法,预测基因之间的相互作用,这对于理解复杂的生物学过程至关重要。NicheNet是一个强大的基因网络分析工具,它通过整合多种数据类型,构建基因网络,并提供丰富的可视化选项,帮助我们深入理解基因之间的相互作用。通过本文的介绍,你应该已经掌握了NicheNet的基本使用方法,包括安装、数据导入、网络构建和结果可视化等。
2025-04-07 08:31:32
858
原创 2025.04.06【技术分享】| MOFA:多视图数据整合与可视化的利器
在生物信息学领域,多组学数据的整合分析已成为揭示生物系统复杂性的关键。MOFA(Multi-Omics Factor Analysis)工具应运而生,它是一种先进的统计方法,专门设计用于整合和分析来自不同组学平台的数据。MOFA通过因子分析技术,能够识别影响多个组学数据集变异的共同因子,从而揭示样本间和样本内的异质性。这种方法不仅适用于大规模数据集,也能处理小样本量的情况,对于含有缺失值的数据同样有效。MOFA的核心优势:能够整合来自不同组学平台的数据,如基因组学、转录组学、蛋白质组学等。
2025-04-06 08:33:44
584
原创 2025.04.06【技术前沿】| MIMOSCA:革命性的分类与整合扰动分析工具
MIMOSCA是一个革命性的分类与整合扰动分析工具,它专门设计用于处理和分析单细胞RNA测序数据。这个工具的核心功能包括数据的分类、整合和扰动分析,能够帮助研究人员理解细胞状态的变化和细胞间的相互作用。MIMOSCA通过使用先进的算法和计算框架,使得处理大规模数据集变得更加高效和准确。
2025-04-06 08:31:37
933
原创 2025.04.05【技术前沿】| MAGIC:多维数据降维与填补的交互式可视化工具
在生物信息学领域,MAGIC(Multidimensional Analysis of Genomic Intervals by Computational methods)是一个强大的工具,它能够帮助研究者分析基因组区间的多维数据。MAGIC通过整合多种生物信息学数据源,如基因表达、表观遗传标记和基因组变异等,提供了一个综合的分析平台。这个工具的核心价值在于其能够揭示基因组区间在不同维度上的相关性和模式,这对于理解基因调控网络和疾病相关变异具有重要意义。
2025-04-05 08:33:35
1021
固态硬盘选购一览表.xlsx
2020-08-28
7.17丨服务器性价比调研表.xlsx
2020-08-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人