GWAS筆記4-LDSC

為什么要做LDSC

通過GWAS分析可以識(shí)別到與表型相關(guān)的SNP位點(diǎn)扛邑,然而嚴(yán)格來講剑鞍,這個(gè)結(jié)果并不一定真實(shí)客觀的描述遺傳因素對(duì)表型的效應(yīng)昨凡,因?yàn)槠浣Y(jié)果是由以下兩個(gè)因素共同構(gòu)成的:

  1. polygenic effects, 基因?qū)Ρ硇偷男?yīng)

  2. confounding factors, 混淆因素,比如群落分層蚁署,樣本間隱藏的親緣關(guān)系等等

盡管我們?cè)贕WAS分析中便脊,可以通過協(xié)變量來校正群落分層等因素,但是混淆因素是無法完全消除的光戈。為了保證分析結(jié)果的準(zhǔn)確性哪痰,我們就需要評(píng)估GWAS分析結(jié)果中以上兩個(gè)因素的占比遂赠,只有當(dāng)混淆因素占比很低時(shí),才能說明我們的分析結(jié)果是可靠的晌杰,此時(shí)我們就可以通過LDSC來探究這個(gè)混淆因素的占比跷睦。

什么是LDSC

LDSC本質(zhì)是一個(gè)線性回歸,其輸入數(shù)據(jù)為GWAS的分析結(jié)果肋演,回歸的自變量SNP位點(diǎn)的LD score值抑诸,因變量是該算法的核心,自定義的一個(gè)符合卡方分布的統(tǒng)計(jì)量爹殊,通過線性回歸擬合LD score和卡方統(tǒng)計(jì)量的關(guān)系蜕乡,從而判斷GWAS分析結(jié)果中是否存在混淆因素。

首先來看下自變量LD score, 對(duì)于一個(gè)SNP位點(diǎn)j梗夸,其LD score定義該位點(diǎn)與其鄰近位點(diǎn)的連鎖不平衡R2的總和晾嘶,公式如下

LD score

然后再來看下因變量痒筒,公式如下

image.png

其中N為樣本總數(shù)号杠,M為窗口內(nèi)的其他SNP位點(diǎn)數(shù)朴爬,h2是遺傳力,這幾個(gè)值為常數(shù)惰帽,從公式可以看出憨降,卡方統(tǒng)計(jì)量和LD score之間是一個(gè)線性關(guān)系,而且對(duì)應(yīng)到圖像上该酗,其截距為1授药。上述公式是只考慮遺傳效應(yīng)的前提下得到,如果存在混淆因素呜魄,那么最后的截距就不是1了悔叽。

應(yīng)用

通過LDSC回歸分析的截距,可以判斷GWAS結(jié)果中是否存在混淆因素爵嗅。如果截距在1附近娇澎,說明沒有混淆因素,如果解決超過這個(gè)范圍睹晒,說明有混淆因素的存在趟庄。同時(shí)公式中涉及到了遺傳力,通過LDSC也可以評(píng)估遺傳力的大小伪很。

針對(duì)單個(gè)表型的GWAS分析戚啥,LDSC可以鑒定是否存在混淆因素,估計(jì)遺傳力的大酗笔浴猫十;對(duì)于多個(gè)表型,則可以根據(jù)對(duì)應(yīng)的卡方統(tǒng)計(jì)量,計(jì)算表型間的遺傳相似度拖云。

我們經(jīng)常在scATAC-seq的文章中看到的這種熱圖就代表了每種細(xì)胞類型特異的峰所富集的LDSC GWAS-SNP的顯著性贷笛,每行代表一個(gè)GWAS study的SNP集合,每一列代表一種細(xì)胞類型特異的peaks

image.png

代碼

http://www.github.com/bulik/ldsc


參考

https://blog.csdn.net/weixin_43569478/article/details/108079805

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末江兢,一起剝皮案震驚了整個(gè)濱河市昨忆,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌杉允,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,723評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件席里,死亡現(xiàn)場離奇詭異叔磷,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)奖磁,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,485評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門改基,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人咖为,你說我怎么就攤上這事秕狰。” “怎么了躁染?”我有些...
    開封第一講書人閱讀 152,998評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵鸣哀,是天一觀的道長。 經(jīng)常有香客問我吞彤,道長我衬,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,323評(píng)論 1 279
  • 正文 為了忘掉前任饰恕,我火速辦了婚禮挠羔,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘埋嵌。我一直安慰自己破加,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,355評(píng)論 5 374
  • 文/花漫 我一把揭開白布雹嗦。 她就那樣靜靜地躺著范舀,像睡著了一般。 火紅的嫁衣襯著肌膚如雪俐银。 梳的紋絲不亂的頭發(fā)上尿背,一...
    開封第一講書人閱讀 49,079評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音捶惜,去河邊找鬼田藐。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的汽久。 我是一名探鬼主播鹤竭,決...
    沈念sama閱讀 38,389評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼景醇!你這毒婦竟也來了臀稚?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,019評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤三痰,失蹤者是張志新(化名)和其女友劉穎吧寺,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體散劫,經(jīng)...
    沈念sama閱讀 43,519評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡稚机,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,971評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了获搏。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赖条。...
    茶點(diǎn)故事閱讀 38,100評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖常熙,靈堂內(nèi)的尸體忽然破棺而出纬乍,到底是詐尸還是另有隱情,我是刑警寧澤裸卫,帶...
    沈念sama閱讀 33,738評(píng)論 4 324
  • 正文 年R本政府宣布仿贬,位于F島的核電站,受9級(jí)特大地震影響彼城,放射性物質(zhì)發(fā)生泄漏诅蝶。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,293評(píng)論 3 307
  • 文/蒙蒙 一募壕、第九天 我趴在偏房一處隱蔽的房頂上張望调炬。 院中可真熱鬧,春花似錦舱馅、人聲如沸缰泡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,289評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽棘钞。三九已至,卻和暖如春干毅,著一層夾襖步出監(jiān)牢的瞬間宜猜,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,517評(píng)論 1 262
  • 我被黑心中介騙來泰國打工硝逢, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留姨拥,地道東北人绅喉。 一個(gè)月前我還...
    沈念sama閱讀 45,547評(píng)論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像叫乌,于是被迫代替她去往敵國和親柴罐。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,834評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容