R數(shù)據(jù)分析:孟德爾隨機化分析文獻解析和實例操練

最近抽空研讀了一篇探討高血壓和腎功能關(guān)系的文獻芥驳,記錄下來分享給大家郑藏,主要也是想看看孟德爾隨機化的統(tǒng)計分析結(jié)果在論文中是如何呈現(xiàn)的较性,之后我會給大家寫寫孟德爾隨機化的統(tǒng)計分析在R語言中的做法,希望可以幫助到大家壶栋。

文章的題目是A bidirectional Mendelian randomization study supports causal effects of kidney function on blood pressure辰如,這篇文章用到的統(tǒng)計技巧叫做Two-sample MR----兩樣本孟德爾隨機分析。我還查閱了別的孟德爾隨機化的文獻贵试,這個Two-sample MR的分析其實是非常常用的琉兜。

Two-sample MR分析的一般步驟

第一步是找工具變量,我們要的是基因作為工具變量這些個基因都是從別人的研究中挑出來的毙玻,所有的基因研究有個專門的庫叫做genome wide association studies (GWAS)豌蟋。我們需要做的就是從這個庫中挑出來我們自己需要的和我們暴露相關(guān)的基因變量SNPs。這是第一步桑滩。

第二步就是估計我們的工具變量對結(jié)局的作用梧疲,工具變量對結(jié)局的作用也是從所有的研究中估計出來的整體效應(yīng),這樣可以拒絕單個研究的偏倚施符。

第三步就是合并多個SNP的效應(yīng)量往声,這個效應(yīng)量是我們得到暴露和結(jié)局因果效應(yīng)的前提。

第四步就是用合并后的數(shù)據(jù)進行孟德爾隨機化分析和相應(yīng)的敏感性分析戳吝。

做分析的整個流程就在下面的圖中啦:

總體來看就是在孟德爾隨機化研究中我們的工具變量可以不需要你收集,工具變量的效應(yīng)也不需要你計算贯涎,這些都只需要你在GWAS挖掘合并就行听哭。就是說做孟德爾隨機化研究是不需要你有原始數(shù)據(jù)的。

我們把上面的步驟具體在剛剛提到的文獻中走一遍:

這篇文獻是要研究高血壓和腎功能的因果方向的塘雳,就是到底是高血壓導(dǎo)致腎功能下降陆盘,還是腎功能下降導(dǎo)致的高血壓,具體地就是研究eGFRcr和BP的因果方向败明。

首先作者從別人的基因研究中找自己研究變量的工具變量隘马,別人的研究的情況如下表:注意下表是包含一個聯(lián)盟的很多個研究的(腎功能的工具變量是從CKDGen Consortium找來的,血壓的工具變量是UKB-ICBP中找來的)妻顶,是需要進行meta整合的:

通過meta分析作者就篩選出了兩個變量可能的工具變量酸员,因為每個變量的工具變量其實是比較多的蜒车,為了保證同一個變量工具變量間的獨立性,作者有做一個叫LD clumping的操作:

To ensure independence among genetic instruments, we applied LD clumping60 with a clumping window of 10 MB and an r2 cutoff of 0.001 (default of the ld_clumpfunction)

作者有把篩出來的變量的暴露和結(jié)局的工具變量展示在文獻中(但是放在補充材料中的幔嗦,我并沒有能找到酿愧,欸)

然后就到第二步和第三步,估計工具變量對暴露和結(jié)局的作用邀泉,這個時候要考慮工具變量一定不能直接影響結(jié)局(叫做pleiotropy)嬉挡,所以作者會用好幾個算法來估計SNP的作用,并將多個SNP的效應(yīng)合并汇恤,用到的是harmonise_data這個函數(shù)庞钢。

工具變量其實有很多的,所以就有上面提到的pleiotropic問題因谎,作者是用不同的方法來估計參數(shù)(inverse variance weighted method, mendelian randomisation-Egger (MR-Egger) method, weighted median method, and weighted mode based estimation)來均衡pleiotropic問題的影響焊夸,最后得到一個總的合并后的效應(yīng),這個效應(yīng)被認(rèn)為是比較穩(wěn)健的:

We applied four complementary methods of two sample mendelian randomisation (inverse variance weighted method, mendelian randomisation-Egger (MR-Egger) method, weighted median method, and weighted mode based estimation), which make different assumptions about horizontal pleiotropy. A consistent effect across the four methods is less likely to be a false positive.

有了合并后的工具變量對結(jié)局的效應(yīng)蓝角,最后一步就是mr分析阱穗,估計暴露與結(jié)局的直接因果效應(yīng)。

整個文獻就是這么回事使鹅,正文中呈現(xiàn)出來的圖表包括下面兩個揪阶,一個是腎功能對血壓的作用的森林圖和效應(yīng)的置信區(qū)間和p值,另一個是血壓對腎功能的作用的森林圖和效應(yīng)的置信區(qū)間和p值:

最終作者得到腎功能是影響血壓的原因患朱,而非相反鲁僚。整個文獻就完啦,這個就是一個完整的孟德爾隨機化研究的統(tǒng)計呈現(xiàn)過程裁厅。

Two-sample MR實操

接下來給大家寫如何做出文獻中的結(jié)果:

Two sample Mendelian randomisation (2SMR) is a method to estimate the causal effect of an exposure on an outcome using only summary statistics from genome wide association studies (GWAS).

具體地冰沙,作者使用的R包是‘TwoSampleMR’。

使用TwoSampleMR的基本流程包括4步:

選擇工具變量

從GWAS數(shù)據(jù)庫提取工具變量

合并效應(yīng)量

做MR分析执虹,敏感性分析拓挥,畫圖,出報告

在分析中我們要使用SNPs來作為工具變量:

Mendelian randomization is a method to assess the causal effect of an exposure on an outcome using an instrument, defined by one or more SNPs, as a proxy for the exposure.

這個工具變量怎么來呢袋励,有人已經(jīng)把所用的可能用到的SNPs總結(jié)好了放在了R包里侥啤,我們直接用就行,從GWAS中獲取茬故,我們需要在GWAS中找到暴露相關(guān)的工具變量和結(jié)局相關(guān)的工具變量從而形成兩個樣本盖灸,相應(yīng)的分析跑兩次,所以一般文獻中的分析方法就叫做two-sample Mendelian randomization

Methodological advances mean that Mendelian randomization can be implemented using summary statistics from GWAS, without individual level data. This requires SNP-exposure associations and SNP-outcome associations obtained from separate datasets and is known as two-sample Mendelian randomization

這里又有許多術(shù)語需要給大家做做鋪墊:

孟德爾隨機化:Mendelian randomization is a method to assess the causal effect of an exposure on an outcome using an instrument, defined by one or more single nucleotide polymorphisms, as a proxy for exposure.(SNP就是工具變量)

Genome-wide association study (GWAS):Genome-wide association studies identify the genetic variants that are associated with a given phenotype.和暴露(表型)相關(guān)的基因都是從GWAS中找的

Heterogeneity:Heterogeneity is defined as the variation in the causal estimate across SNPs.這個是不同SNP效應(yīng)的異質(zhì)性磺芭,所以多個SNP的效應(yīng)是需要合并的

其實還有好多赁炎,感覺寫不完。钾腺。徙垫。直接上例子吧

實例解析

我現(xiàn)在想通過孟德爾隨機化研究血壓和冠心病的關(guān)系讥裤,首先我們得接入孟德爾隨機基礎(chǔ)庫MR-Base這個數(shù)據(jù)庫,找到相應(yīng)的結(jié)局(即血壓和冠心菜尚啊)的相關(guān)基因坞琴,代碼如下:

ao<- available_outcomes()exposure_dat<- extract_instruments(c('ukb-a-360'))outcome_dat<- extract_outcome_data(exposure_dat$SNP, c('7'), proxies=1, rsq = 0.8, align_alleles = 1, palindromes=1, maf_threshold = 0.3)

運行上面的代碼然后你去查看對象exposure_dat或者outcome_dat就會看到相關(guān)基因研究的基本特征,給大家截個圖吧:

然后計算基因?qū)Y(jié)局的合并效應(yīng)量逗抑,代碼如下:

dat<-harmonise_data(exposure_dat,outcome_dat,action=2)

最后一步就是進行mr分析:

mr_results<- mr(dat)

運行所有的代碼后我們就可以得到不同算法模型下我們的結(jié)果如下圖兩圖:

文獻中的結(jié)果

我跑出來的結(jié)果

可以看到上面的圖是文獻中的剧辐,底下的圖是我自己復(fù)現(xiàn)出來的,一模一樣哦邮府。可以看出來血壓是對冠心病有因果影響的荧关,我們還可以得到相應(yīng)系數(shù)的置信區(qū)間:

generate_odds_ratios(mr_results)

同時因為我們是選了很多個SNP進行的效應(yīng)估計,我們可以出整個SNP效應(yīng)的森林圖和漏斗圖褂傀,漏斗圖可以幫我們看SNP的異質(zhì)性忍啤,我們還可以用Cochran’s Q and I2統(tǒng)計量檢驗不同SNP的異質(zhì)性,然后選擇正確的方法對各個SNP的效應(yīng)進行合并得到總效應(yīng)

從森林圖就可以看到仙辟,整個血壓的工具變量對腎功能的作用也是顯著的同波,同時我們可以出散點圖直接看出來血壓對腎功能的系數(shù),如下:

上圖就是不同參數(shù)估計方法下面估計出來的暴露(血壓)對結(jié)局(腎功能)的因果效應(yīng)叠国,這個圖的縱軸是工具變量對結(jié)局的影響效應(yīng)未檩,橫軸是工具變量對暴露的因果效應(yīng),兩個效應(yīng)做比值就是暴露對結(jié)局的效應(yīng)粟焊,也就是圖中線的斜率冤狡,也可以看出來這個線不同的算法估計出來是有些許差異的,但總體是斜向上的项棠,就意味著暴露(血壓)對結(jié)局(冠心脖ā)是有著正向的因果關(guān)系的。

然后再用同樣的方法做一遍冠心病對血壓的因果關(guān)系的分析(流程完全一樣就不重復(fù)了)香追,做完之后發(fā)現(xiàn)冠心病對血壓其實是沒有因果作用的合瓢,這樣我們就知道了其實是血壓導(dǎo)致了冠心病而非冠心病導(dǎo)致了血壓升高,這樣一個完整的孟德爾隨機化研究就完成了翅阵。

可以看到一個孟德爾隨機化研究好像也不難哦歪玲。好啦,今天就到這兒吧掷匠,今天有粉絲在通話中鼓勵我繼續(xù)(趕緊)寫公眾號文章,有被感動到岖圈,所以特更一期讹语,哈哈。

小結(jié)

今天從一篇文獻出發(fā)給大家寫了孟德爾隨機化的流程和做法蜂科,希望可以幫助到大家顽决,感謝大家耐心看完短条,自己的文章都寫的很細,代碼都在原文中才菠,希望大家都可以自己做一做茸时,請關(guān)注后私信回復(fù)“數(shù)據(jù)鏈接”獲取所有數(shù)據(jù)和本人收集的學(xué)習(xí)資料馁筐。如果對您有用請先收藏谣旁,再點贊轉(zhuǎn)發(fā)战授。

也歡迎大家的意見和建議胞皱,大家想了解什么統(tǒng)計方法都可以在文章下留言迫皱,說不定我看見了就會給你寫教程哦舔稀,另歡迎私信茉兰。

本文參考文獻:

Wootton RE, Lawn RB, Millard LA, et al. : Evaluation of the causal effects between subjective wellbeing and cardiometabolic health: mendelian randomisation study.?BMJ.?2018;362:k3788. 10.1136/bmj.k3788

A bidirectional Mendelian randomization study supports causal effects of kidney function on blood pressureYu, Zhi et al.Kidney International, Volume 98, Issue 3, 708 - 716

Clinical effect of naturally random allocation to lower systolic blood pressure beginning before the development of hypertension.Ference BA, Julius S, Mahajan N, Levy PD, Williams KA Sr, Flack JMHypertension. 2014 Jun; 63(6):1182-8.

Bowden, Jack, George Davey Smith, and Stephen Burgess. 2015. “Mendelian randomization with invalid instruments: effect estimation and bias detection through Egger regression.”?International Journal of Epidemiology?In press.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末泌参,一起剝皮案震驚了整個濱河市步悠,隨后出現(xiàn)的幾起案子签杈,更是在濱河造成了極大的恐慌,老刑警劉巖鼎兽,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件答姥,死亡現(xiàn)場離奇詭異,居然都是意外死亡谚咬,警方通過查閱死者的電腦和手機鹦付,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來序宦,“玉大人睁壁,你說我怎么就攤上這事』グ疲” “怎么了潘明?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長秕噪。 經(jīng)常有香客問我钳降,道長,這世上最難降的妖魔是什么腌巾? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任遂填,我火速辦了婚禮,結(jié)果婚禮上澈蝙,老公的妹妹穿的比我還像新娘吓坚。我一直安慰自己,他們只是感情好灯荧,可當(dāng)我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布礁击。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪哆窿。 梳的紋絲不亂的頭發(fā)上链烈,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天,我揣著相機與錄音挚躯,去河邊找鬼强衡。 笑死,一個胖子當(dāng)著我的面吹牛码荔,可吹牛的內(nèi)容都是我干的漩勤。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼目胡,長吁一口氣:“原來是場噩夢啊……” “哼锯七!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起誉己,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤眉尸,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后巨双,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體噪猾,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年筑累,在試婚紗的時候發(fā)現(xiàn)自己被綠了袱蜡。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡慢宗,死狀恐怖坪蚁,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情镜沽,我是刑警寧澤敏晤,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站缅茉,受9級特大地震影響嘴脾,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蔬墩,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一译打、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧拇颅,春花似錦奏司、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽哥谷。三九已至岸夯,卻和暖如春麻献,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背猜扮。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工勉吻, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人旅赢。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓齿桃,卻偏偏與公主長得像,于是被迫代替她去往敵國和親煮盼。 傳聞我的和親對象是個殘疾皇子短纵,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容