孟德尔随机化分析和GWAS分析有什么区别？

育种数据分析之放飞自我

已于 2024-09-14 12:40:42 修改

阅读量1k

点赞数 6

文章标签：程序人生学习方法线性回归数据结构

于 2024-09-14 12:30:56 首次发布

互秀朋友圈呀, 微信: yijiaobani, 备注: 姓名+ 单位

本文链接：https://blog.csdn.net/yijiaobani/article/details/142255340

版权

大家好，我是邓飞。

最近一直在研究孟德尔随机化分析，已经从概念到实操了，程序已经跑通了，很开心。这几天写的博客：

孟德尔随机化的术语理解

从一篇孟德尔随机化文章看MR常见结果形式

对于GWAS分析，从原理到实操，我是比较熟悉的，还编写了一本GWAS分析教程V6版，在学习孟德尔随机化分析的过程中，我发现GWAS的结果是MR的输入，所以关系应该是先有GWAS分析，再有MR分析。

1. 关联 VS 因果

GWAS分析：GWAS是一种用于识别与复杂性状（如疾病、性状等）相关的遗传变异的方法。通过对大规模人群进行基因组扫描，GWAS可以发现单核苷酸多态性（SNP）与某一性状的关联。这些关联通常体现在统计学上的显著性水平。

孟德尔随机化分析：孟德尔随机化则是一种利用遗传变异作为工具变量来研究因果关系的方法。它的基本思想是利用随机分配的基因型来消除混杂因素的影响，从而评估某一暴露（如生活方式、饮食习惯等）与结果（如疾病）的因果关系。

从概念上也可以看出来，GWAS是关联分析，研究的是相关。MR是因果分析，研究的是因果。我们知道，相关不一定是因果，因果一定相关。有时我们观察到的相关性可能是偶然的，或是由于未控制的混杂因素导致的。因此，观察到的相关性（例如通过GWAS发现的）不一定意味着存在因果关系。根据因果推断的定义，如果一个因素（如某个生物标志物或行为）确实导致另一个结果（如疾病发生），那么这两个变量之间一定会存在统计相关性，即因果关系必然伴随相关性。然而，只有相关性并不一定证明因果关系，反之却是成立的。

2. 是否受混杂因素的影响

GWAS: GWAS的主要目标是识别关联，但这些关联可能受到混杂因素（例如环境因素、生活方式等）的影响，因此仅靠GWAS的结果很难直接推断因果关系。

MR:由于遗传变异是随机分配给个体的，因此在使用遗传变异作为工具变量时，MR能够有效控制混杂因素。例如，如果某个SNP与胆固醇水平相关，同时也与心脏病相关，MR可以利用这个SNP来推断胆固醇对心脏病的因果影响，而不会受到那些混杂因素的影响。

GWAS容易受到混杂因素的影响，MR可以控制混杂因素。

3. 假设检验不一样

GWAS的假设检验很简单，它假定基因组上的SNP至少有一个与控制性状的基因处于连锁不平衡状态。

MR分析有三个假设，分别是关联性假设、独立性假设和排他性假设。

GWAS有一个假定比较容易满足，一般位点数覆盖基因组上，上量后都能满足；MR工具变量有三个假定，分析时需要注意。

结论汇总：

总的来说，GWAS和MR在理论上是紧密相关的：GWAS提供了用于MR分析的遗传工具变量，而MR利用这些工具变量进行因果推断。二者共同构成了现代遗传流行病学研究的重要基础，帮助研究人员揭示复杂性状和疾病的遗传机制。GWAS在前，MR在后，GWAS提供素材，MR给于升华。