咨询热线:400-065-6886
首页>>技术支持>>科研进展

【昊工具】GWAS研究者不能错过的在线孟德尔随机化分析网站:MR-base


上海天昊生物 
 

因为爱一个人,

连带爱上他屋顶上的乌鸦。

但是反过来因为屋顶上的乌鸦而爱上这个人,

怕是极少见的吧?

类似“爱屋及乌”这样的因果关系显而易见,

但是医学领域的这种因果关系应该如何判断和研究呢?

 

 

医学领域的因果关系

 
医学上,因果关系的判断非常的重要,很多疾病的病因(我们称之为暴露因素)如果能早早找到,那么疾病(我们称之为结局)就可能被提早干预而被避免。但是实际情况是,这种因果关系的研究困难重重。比如我们要去判断抽烟和肺癌是否存在因果关系,可以选择一组抽烟和一组不抽烟的人,分别跟踪30-50年去观察最终的肺癌发生率。虽然这是一个非常好的研究思路,但是不省时不省力。对于大部分横断面研究来说,最大的问题是我们观察到的是相关性,而不是因果关系。比如,维生素B缺乏和脱发有关,那么,到底是维生素B缺乏导致脱发(那么赶紧补维B吧!),还是因为脱发的人生活不规律、熬夜(我们称为混杂因素)而导致维生素B缺乏呢?(补再多维B也没用…)
用于探究因果关系的孟德尔随机化分析(Mendelian randomization,MR)
Katan1986 提出:依据孟德尔遗传定律,父母的等位基因随机分配给子代,子代的不同基因型决定不同的中间表型。假设AA和aa基因型的人天生因为基因的差别而导致血液维生素B的水平不同,那如果我们想研究维B和脱发的关联,则可以改为更加简单的研究方法:研究AA和aa基因型和脱发的关联(因为基因型和维B水平的因果关系是明确的)。那到底维B能否导致脱发呢?想要得出这个结论,必须有三个前提条件:
1) 基因型(比如AA/aa)与中间表型(维B水平)高度相关;
2) 基因型(比如AA/aa)与混杂因素(如饮酒习惯,熬夜习惯)等混杂因素不相关;
3) 基因型(比如AA/aa)与疾病(如脱发)条件独立(即将维B水平和基因型同时作为自变量联合分析时,基因型与脱发的相关性消失)

 

 

MR分析的基本步骤

 
如果有来自相同人群的2个独立样本的GWAS分析结果数据,我们便得到了1)基因与暴露因素的关联结果,2)基因与结局的关联结果,基于这样的2套数据,统计学家开发了两样本MR(Two-sample MR)方法,用于研究暴露因素与结局的因果关系。目前,两样本MR因为全球大量GWAS统计结果的免费公开而被广泛使用。
 
●让我们来看看孟德尔随机化分析近年的发文趋势:



 

计算原理:
1) GWAS数据里面找到影响维B水平的SNP位点 (比如满足P小于5*10-8的位点)
2) 提取这些位点在脱发GWAS研究中的关联效应值(BETA)或者风险值(OR)
3) 散点图绘制这些位点分别在维B水平GWAS和脱发GWAS的效应值,散点图的斜率代表维B水平对脱发这个结局的影响大小(causal effect)

 
 

临床医生就能轻松使用的MR分析网站-- MR-Base (http://www.mrbase.org):

 
不用去找GWAS数据,不用复杂编程,科学家们已经帮我们开发好了在线版MR分析工具。临床医生可以利用数据库里面的1673个GWAS结果数据进行MR分析,也可以上传自己的GWAS数据结果进行再次数据挖掘。
参考文献:Hemani G, Zheng J, Elsworth B, et al. The MR-Base platform supports systematic causal inference across the human phenome. Elife. 2018;7:e34408. Published 2018 May 30. doi:10.7554/eLife.34408



 

 

数据库的数据类型:



 

 

分析流程:
1) 读取暴露因素的gwas结果,可以上传自己的GWAS数据
2) 读取结局变量的gwas结果(不可上传自己的GWAS)
3) 调整匹配两个GWAS数据(如SNP链统一,SNP信息不一致的删去,SNP点不存在的用连锁点替代)
4) 执行MR分析和图形展示。



 

 

操作步骤:
拢共分为三步



 

1)选暴露因素



 

 

2)选结局


 

3)MR分析

 

结果展示:


 

1)MR results:展示4种不同分析方法用到的SNP个数(nsnp),散点图的斜率(b),标准误(se)和显著性(pval)。由于所有P值都不显著,因此ApoA1水平与AD发病不存在因果关系。
2)基于四个方法的MR分析的散点图(斜率展示了4个方法得出的效应值大小),与1)的结果相对应。



 

 

3)纳入分析的6个SNP的效应大小展示。


 

4) 为了判断MR分析的敏感性(可以理解为判断分析是否靠谱),网站还进行了多种敏感性分析。
比如:heterogeneity statistics (判断来源于不同的GWAS数据的SNP是否存在异质性影响结果,如果最后的pval大于0.05, 则说明纳入的SNP没有异质性。


 

比如:Horizontal pleiotropy (水平多效性。MR分析得出因果关系的前提是SNP必须只能通过暴露因素影响结局,而不能直接与结局相关。如果SNP与暴露因素和结局都直接相关,那么这个MR分析就存在水平多效性,结局也就是不可信的)。这里的p-value大于0.05,即提示水平多效性不存在。



 

备注:专业人士可以采用这个团队为大家提供的R包,可以进行更加灵活地分析:
https://mrcieu.github.io/TwoSampleMR/

 

 

更多阅读

 
该工具发表于2018年,目前引用超600次。



 

来看看一篇最新的引用文章:
Elife (IF: 7.08). 2020 Oct 16;9:e58914. doi: 10.7554/eLife.58914.
Effects of lifelong testosterone exposure on health and disease using Mendelian randomization
PMID: 33063668 PMCID: PMC7591257 DOI: 10.7554/eLife.58914
摘要:很多男性日常服用睾丸激素产品,以获得各种可能的健康益处,但其因果效应尚不清楚。临床随机试验难以开展,也很难用于研究这些产品的长期效应或对罕见结果的影响。本研究基于孟德尔随机化分析,推断游离睾丸酮对161,268名来自英国生物库研究的男性的461种表型的影响。研究结果表型,终身服用游离睾丸酮具有骨密度增加、体脂减少的有益影响;不利影响包括:高密度脂蛋白减少、前列腺癌、雄激素性脱发、椎管狭窄和高血压风险增加;对血细胞比容增加和C反应蛋白减少有背景依赖性影响。对2型糖尿病、心血管或认知结果没有观察到益处。孟德尔随机化表明,应综合考虑长期增加睾酮的益处与不良影响,特别是增加前列腺癌和高血压的风险。未来需要进行足够效能的随机试验,以最终阐释睾酮治疗对这些结果的风险和益处。
临床上的因果关系,如果你也好奇,快用MR-base分析看看吧!

 

咨询沟通请联系

18964693703(微信同号)

创新基因科技,成就科学梦想

微信扫一扫
关注该公众号

 

 




上海昊为泰生物科技有限公司 版权所有 沪ICP备18028200号-1
地址:上海市浦东新区康桥路787号9号楼 邮箱:techsupport@geneskies.com 电话:400-065-6886