生信中的PCA ,PCoA

生信中的PCA ,PCoA

PCA和PCOA都是降维处理数据集,只不过前者是主成分分析后者是主坐标分析。不过在生信分析中都是用来查看样本之间的相似性或者差异性。
首先要明白一个道理,为什么生信中要进行数据降维,简单的道理就是数据集太大了,不便于我们做数据统计和分析,举个例子,我们做一个16sDNA分析,样本是200个,每一个样本就是一个维度,这样就相当于200个维度,对于如此多的维度我们根本无法理解,就好比二维空间无法理解三维空间。
所以我们进行降维处理。降维到我们能理解的维度,便于我们统计分析。
PCA(主成分分析)
进行降维的思想,然后用方差分解,使得差异贡献值放在二维坐标轴上,如下图(这里是iris数据画的pca图)
同一种的鸢尾花用相同的颜色表示,点与点之间靠的越近说明越相似。X轴是第一主成分贡献值,Y轴是第二主成分贡献值。
在这里插入图片描述
PCoA

同样采用降维思想,但是PCoA则是将样本数据经过不同距离算法获得样本距离矩阵的投影,在图形中样本点的距离等于距离矩阵中的差异数据距离。(这里说明一下,一般来说PCA是对样本得到丰度数据直接进行降维,PCoA则是经历了距离计算,比方说欧氏距离。这里有一个特点就是直接用丰度数据一组只有两个样本的时候降维就为1了,就不能pca分析,但是基于欧氏距离来算的话就不是组里降维二十全部的样本弄成nxn的形式降维成nx(n-1),这里pca又是可以的。)
PCoA看图就也是靠的近的相似性高。
(python关于PCoA的计算太少了,基本都是用R 语言画的,这里我也用R展示一下)
在这里插入图片描述

### 使用DESeq2进行PCA主成分分析 为了使用DESeq2软件包执行主成分分析(PCA),并基于差异表达基因更好地区分不同类型的样本,如癌和癌旁组织,可以遵循以下方法[^1]。 #### 准备工作环境 首先加载必要的R库,并读取或创建所需的计数矩阵以及对应的元数据文件: ```r library(DESeq2) # 假设已经有一个名为dds的对象包含了实验设计息 data <- read.csv("counts_matrix.csv", row.names=1) colData <- data.frame(condition=factor(c(rep("control", 3), rep("treated", 3)))) dds <- DESeqDataSetFromMatrix(countData=data, colData=colData, design=~condition) ``` #### 差异表达分析 接着运行差异表达分析流程,这一步骤会计算每个基因在不同条件下是否存在显著变化: ```r dds <- DESeq(dds) res <- results(dds) ``` #### 提取标准化后的表达值 对于后续的PCA分析来说,通常建议先对原始计数值应用某种形式的变化以减少技术变异的影响。在这里可以选择使用`regularized-logarithm transformation (rlog)`变换作为预处理步骤之一: ```r vsd <- vst(dds, blind=FALSE) head(assay(vsd)[, 1:2]) ``` 上述命令将会展示前几行经过vst转换后的表达水平,这些值可以直接用于PCA绘图[^2]。 #### 执行PCA并绘制图形 最后通过调用`plotPCA()`函数轻松完成PCA图表制作过程,该函数内部实现了所有必要操作,包括计算协方差矩阵、特征向量求解等复杂运算;同时支持自定义颜色方案和其他美学参数设置以便于解读结果: ```r pca_res <- plotPCA(vsd, intgroup="condition", returnDat=TRUE) percentVar <- round(100 * attr(pca_res, "percentVar")) print(plotPCA(vsd, intgroup="condition") + ggtitle(sprintf("PCA plot (%.1f%% / %.1f%% variance explained)", percentVar[1], percentVar[2]))) ``` 这段代码不仅成了一个二维散点图表示各个样品的位置分布情况及其相互关系,还额外提供了两个主要维度所解释总变异性比例的息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值