R数据分析：孟德尔随机化中介的原理和实操

最新推荐文章于 2024-10-07 16:42:54 发布

原创

最新推荐文章于 2024-10-07 16:42:54 发布

· 6.1k 阅读

23 ·

版权

文章标签：

#java #算法 #人工智能

中介本身就是回归，基本上我看到的很多的调查性研究中在中介分析的方法部分都不会去提混杂，都是默认一个三角形画好，中介关系就算过去了，这里面默认的逻辑就是前两步回归中的混杂是一样的，计算中介效应的时候就自动消掉了。

但是，实际上对不对，还是有待具体分析的：

Traditional, non-instrumental variable methods for mediation analysis experience a number of methodological difficulties, including bias due to confounding between an exposure, mediator and outcome and measurement error

孟德尔随机化作为一个天然的免去混杂的方法，和中介结合，整个中介又变得更纯净了，是一种更加值得推崇的中介做法，也是孟德尔随机化研究的必要的延申。

今天给大家介绍孟德尔随机化中介分析的两个方法multivariable MR (MVMR) and two-step MR

先回顾中介作用

中介分析的基本的概念，就是大家熟悉的三角形：

c是总效应，加上中介变量后，A*B是间接效应，C'是直接效应，有总效应=间接效应+直接效应。

上图中如果总效应，直接效应和间接效应方向都相同的情况下，我们还可以报告中介效应比例，为间接效应比上总效应。

上面的图中的中介效应成立依赖几个假设：

首先就是没有混杂，包括变量之间没有混杂（或者像前面写的直

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

公众号Codewar原创作者

关注关注

2
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

R数据分析：孟德尔随机化中介的原理和实操二

Codewar的博客

02-09

4873

上面的流程跑通之后，对于中介分析，我们需要报告间接效应的估计值和置信区间，还有中介比例的估计值和置信区间，类似下面的这样：转存失败重新上传取消但是其实我们是光跑孟德尔是得不到上面的需要的值的（比如间接效应的标准误，中介比例的标准误），此时需要借助的方法之一叫做delta method。转存失败重新上传取消delta method可以帮助我们得到ab相乘的标准误，从而算出中介效应的置信区间。转存失败重新上传取消。

R数据分析：孟德尔随机化实操

Codewar的博客

12-14

1万+

就是通过漏斗图一看都是所有的工具变量都是呈漏斗分布的，就说明没有偏向，这个时候我们认为定向多效性都被冲掉了，不影响。好，解释了上面的一些术语之后，我们实操一波。

参与评论您还未登录，请先登录后发表或查看评论

蛋白组学、中介、共定位分析~这些高级孟德尔方法都用了！| 孟德尔随机化周报（4.10-4.16）...

weixin_47988917的博客

04-24

1635

发文利器孟德尔随机化，郑老师一次性讲清楚！孟德尔随机化课程，入门到高级，郑老师团队主讲，一个月搞定，快速发表论文！孟德尔随机化,Mendilian Randomization，简写为MR，是一种在流行病学领域应用广泛的一种实验设计方法，利用公开数据库就能轻装上阵写文章，甚至是高质量的论文。孟德尔随机化通过引入一个称之为工具变量的中间变量，来分析暴露因素和结局之间的因果关系，解决了传统实验方法由于混...

一起来学孟德尔随机化(Mendelian Randomization)

热门推荐

dege857的博客

06-24

5万+

我们通过TwoSampleMR包把它下载，先使用extract_instruments函数对暴露数据（就是体重BMI的SNP数据）ieu-a-835进行下载，如果是已经下载到电脑里面的数据，我们使用read_exposure_data函数和clump_data函数读取。这三步走完就可以进行MR分析了，代码非常简单。孟德尔随机化（Mendelian randomization，简称MR）是一种基于遗传变异的因果推断方法，其基本原理是利用自然界中的随机分配的基因型对表型的影响来推断生物学因素对疾病的影响。

期待已久的中介孟德尔随机化终于来了

bioInfo_seeker的博客

04-15

7150

说起孟德尔随机化分析，大家都很熟悉，普通的双样本MR可以简单认为双疾病的因果关系，其实就是为了说明暴露因素和结局因素之间通过一些关键的snp产生因果关系，而中介孟德尔随机化分析，就是引入一个第三个因素如下：通过两步MR分析完成两步MR的主要目的是探讨中介变量（mediator）是否能介导暴露对结局影响，一般适用于寻找从暴露到结局的潜在发生机制。一般而言，在进行两步MR分析之前，我们已经获取了暴露对结局的因果效应（假设其为c）。

R数据分析：工具变量回归与孟德尔随机化，实例解析

Codewar的博客

07-12

8902

原谅我又拖更好久，没办法，欸，就是懒，但是所有的单子都是保质保量完成的哈。，今天给大家写工具变量和孟德尔随机化，文章略微有些长，请大家准备好清醒的头脑，和半个小时的阅读时间哈。啥是工具变量回归 Instrumental variable procedures are needed when some regressors are endogenous (correlated with the error term). The procedure for correcting this endogen

孟德尔随机化 delta method

09-02

- *1* *2* *3* [R数据分析：孟德尔随机化中介的原理和实操二](https://blog.csdn.net/tm_ggplot2/article/details/128960105)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_...

看完不会来揍我 | 孟德尔随机化（二）—— 代码实操 | 附代码注释 + 结果解读

weixin_43843918的博客

04-15

4万+

最近真的是超超超超超超超级多的小伙伴们在咨询孟德尔随机化相关的问题和课程，意想不到的那种多！那我怎么办嘞！整呗！主打的就是一个宠粉！

都在用高级孟德尔随机化方法了！| 孟德尔随机化周报（4.3-4.9）

weixin_47988917的博客

04-16

2368

欢迎报名！孟德尔随机化课程，入门到高级，郑老师团队主讲，一个月搞定，快速发表论文！孟德尔随机化,Mendilian Randomization，简写为MR，是一种在流行病学领域应用广泛的一种实验设计方法，利用公开数据库就能轻装上阵写文章，甚至是高质量的论文。孟德尔随机化通过引入一个称之为工具变量的中间变量，来分析暴露因素和结局之间的因果关系，解决了传统实验方法由于混杂因素的存在，而无法有效说明暴露...

孟德尔随机化

linkequa的博客

10-07

831

IVW的应用前提是所有的SNP均为有效的工具变量且相互之间完全独立。②加权中位数估计（Weighted median,WM）：WM为所有的个体SNP效应值按照权重排序后得到的分布函数的中位数。当至少50%的信息来自于有效的工具变量时，WM可得到稳健的估计值。该基因型与年龄、性别等混杂因素无关。②估计工具变量对结局的作用，工具变量对结局的作用也是从所有的研究中估计出来的整体效应，这样可以拒绝单个研究的偏倚。①找工具变量，从其他研究中挑选特定基因作为工具变量，从基因库中挑选需要的和暴露相关的基因变量SNPs。

R数据分析：孟德尔随机化分析文献解析和实例操练

Codewar的博客

07-26

3万+

最近抽空研读了一篇探讨高血压和肾功能关系的文献，记录下来分享给大家，主要也是想看看孟德尔随机化的统计分析结果在论文中是如何呈现的，之后我会给大家写写孟德尔随机化的统计分析在R语言中的做法，希望可以帮助到大家。文章的题目是A bidirectional Mendelian randomization study supports causal effects of kidney function on blood pressure，这篇文章用到的统计技巧叫做Two-sample MR----两样本孟德尔随

解析基因影响：孟德尔随机化的创新思维

笑不语的博客

07-19

3451

本文的目的是探讨使用孟德尔随机化的创新思维来解析基因影响的重要性。孟德尔随机化是一种基于自然突变和基因重新组合的实验设计，通过利用随机分配的基因组合，帮助我们确定基因与个体差异之间的因果关系[1]。与传统的关联研究相比，孟德尔随机化能够提供更可靠的证据和更准确的结果，从而帮助我们更好地理解基因对个体特征和疾病风险的影响。

weixin_30410999的博客

07-22

4479

孟德尔随机化法（Mendelian Randomization，MR）

浓香鸭腿面的博客

09-15

1万+

一、工具变量参考：https://www.zhihu.com/question/29067965 在构建回归模型时，一般将因变量 YYY 拆成两部分，自变量 XXX 和随机误差 εεε。若 XXX 与 εεε 之间存在相关性，则在构建回归模型的时候，导致对 XXX 的参数 βββ 估计不准。如果能找到一个过滤器，把 XXX 中和 εεε 相关的部分过滤掉，只剩下与 εεε 无关的部分，则可以准确估计参数 βββ。工具变量是指与自变量 XXX 相关而与 εεε 无关的变量，工具变量可以作为过滤器，去除 XX

厉害了！交大学者运用孟德尔随机化中介分析登上Nature子刊！

STATMAX的博客

08-03

1063

此外，幸福感对衰老-GIP的因果影响部分通过33个可修改的中介来解释，包括生活方式（如看电视、吸烟和饮食习惯）、行为和表现（如药物使用和认知能力）、身体功能（如肥胖、血脂、肌肉质量和炎症）以及疾病（如心血管疾病、注意力缺陷多动障碍、糖尿病和乳腺癌）。此外，幸福感与较高的衰老-GIP独立相关，调整收入（β=1.00，P=7.25×10^-27）、教育（β=1.01，P=4.04×10^-31）和职业（β=1.07，P=4.50×10^-38）后结果仍然显著。

今天我们来聊一聊孟德尔随机化

庐州月光的博客

12-21

9890

欢迎关注”生信修炼手册”!在传统的实验设计中，由于种种混杂因素的存在，我们仅仅能够分析变量之间的关联性，最典型的比如GWAS, 对于显著的位点，只能够说明这些位点和性状之间存在关联。对于...

孟德尔随机化（MR）入门介绍和分章分享（暂时不解读）

生信小博士的博客

11-22

2093

假设我们要研究咖啡因对高血压的影响。这个基因会影响人体代谢咖啡因的速度，所以我们可以利用基因的遗传变异作为自然随机分配因素，把人群分成两组：携带CYP1A2变异基因和不携带CYP1A2变异基因的组。如果携带CYP1A2变异基因的人摄入相同剂量咖啡因后高血压的发生率显著低于不携带CYP1A2变异基因的人，那么我们就可以认为咖啡因对高血压具有保护作用。如果携带变异基因的人在研究因素和结果上都与不携带变异基因的人有显著差异，那么我们就可以认为这种因素对结果有影响，而不是因果关系反过来导致结果的变化。

孟德尔随机化一区嘎嘎乱杀！| 孟德尔随机化周报（4.24-5.7）

weixin_47988917的博客

05-13

986

孟德尔随机化,Mendilian Randomization，简写为MR，是一种在流行病学领域应用广泛的一种实验设计方法，利用公开数据库就能轻装上阵写文章，甚至是高质量的论文。孟德尔随机化通过引入一个称之为工具变量的中间变量，来分析暴露因素和结局之间的因果关系，解决了传统实验方法由于混杂因素的存在，而无法有效说明暴露因素和结局变量之间因果性的问题。通过PubMed数据库“Mendelian ra...

MVMR是孟德尔随机化什么研究

最新发布

04-09

### MVMR在孟德尔随机化中的应用和研究内容多变量孟德尔随机化（Multivariable Mendelian Randomization, MVMR）是一种扩展的传统孟德尔随机化方法，旨在通过考虑多个暴露因素的同时影响来推断因果关系。这种方法特别适用于当存在多种可能的混杂因素或中介变量时的情况。 #### 方法概述 MVMR的核心理念在于调整其他暴露变量的影响，从而更精确地估计目标暴露对结局的作用[^1]。具体而言，在传统的单变量孟德尔随机化中，通常只关注单一暴露与结局的关系；而在MVMR中，则可以同时纳入多个暴露变量，并假设它们各自独立作用于结局。这有助于区分直接效应和间接效应，尤其是在复杂的生物机制背景下尤为重要。为了实现这一点，研究人员会选取一组遗传变异作为每种暴露的工具变量，并构建多元回归模型来进行分析。例如，在一项关于心血管疾病的MVMR研究中，可能会同时考察血脂水平、血压以及血糖浓度等多个风险因子如何共同决定患病概率[^2]。 #### 技术细节与统计考量实施MVMR时需注意几个关键技术要点： - **工具变量的选择**：每个暴露都应具备至少一个强有效的遗传标记作为其特定工具变量，而且这些工具之间不应高度相关以免造成多重共线性问题。 - **模型设定**：一般采用线性混合效应模型或其他适合处理高维数据的方法来拟合数据。如果某些条件不满足标准假定(如不存在水平多效性)，则可运用额外诊断测试比如MR-PRESSO来检验潜在偏差的存在与否[^3]。 - **稳健性检查**：除了基本的逆方差加权法外，还可以尝试不同的估算策略诸如加权中位数或者模态估计器以确认结果的一致性和稳定性。下面展示了一个简单的Python代码片段演示如何执行基础版本的MVMR计算过程: ```python import numpy as np from statsmodels.api import OLS def mv_mendelian_randomization(X, Y, Z): """ Perform multivariable mendelian randomization. Parameters: X (numpy array): Matrix of exposures. Y (numpy array): Outcome variable. Z (numpy array): Instrumental variables matrix. Returns: dict: Estimated causal effects and standard errors. """ # Stage 1 regression - predict each exposure using IVs beta_hat_X_given_Z = [] for i in range(X.shape[1]): res = OLS(X[:,i], Z).fit() beta_hat_X_given_Z.append(res.params) # Combine predictions into a single design matrix F F = np.dot(Z, np.array(beta_hat_X_given_Z).T) # Stage 2 regression - regress outcome on predicted exposures stage_2_model = OLS(Y, F).fit() return { 'causal_effects': stage_2_model.params, 'std_errors': stage_2_model.bse } ``` 此函数接受三个参数——代表各种暴露量的矩阵`X`, 结果向量 `Y` 和仪器变量集合组成的矩阵 `Z`. 它首先运行第一阶段回归得到预测值F，接着再利用第二阶段回归得出最终因果效应估值及其对应的标准误差。 #### 应用实例实际案例方面，我们可以设想这样一个场景：科学家们想要探究饮食习惯、运动频率及睡眠时间这三个生活方式要素分别对于肥胖症发生率的具体贡献度。借助大规模人群队列所提供的详尽基因分型资料加上相应的生活方式问卷调查记录，他们能够挑选出一系列可靠的SNP作为上述各行为模式的有效代理指标，进而开展全面深入的MVMR剖析工作。 ---