概覽
- Title:From GWAS to Function: Using Functional Genomics to Identify the Mechanisms Underlying Complex Diseases
- 標(biāo)題:從GWAS到功能:使用功能基因組學(xué)識(shí)別復(fù)雜疾病的潛在機(jī)制
- Date:2020.5.13
- Journal:Frontiers in Genetics(IF=4.7)
- Citations:370
一句話(huà)簡(jiǎn)介
文章對(duì)后GWAS時(shí)代的研究熱點(diǎn)-探究非編碼SNP的功能探究進(jìn)行了綜述,并探討了未來(lái)的發(fā)展方向匀奏。
雖然IF不高,但這是一篇通俗易懂的好文章,從citation數(shù)就可以看出。非常適合初學(xué)者(我)學(xué)習(xí)入門(mén)掰茶。
綜述結(jié)構(gòu)
引言
-
識(shí)別與復(fù)雜疾病相關(guān)的細(xì)胞類(lèi)型
- 基于全基因組顯著性Gwas變異的Snp富集分析
- 全基因組 Snp 富集分析
- 基于Snp遺傳力的富集分析
-
優(yōu)先考慮GWAS位點(diǎn)的致病基因
- 共定位分析
- 共定位在復(fù)雜疾病中的應(yīng)用
- Twas:基因和性狀的直接關(guān)聯(lián)
-
解釋GWAS關(guān)聯(lián)的未來(lái)前景
- GWAS與單細(xì)胞基因組學(xué)的整合
- 多基因風(fēng)險(xiǎn)評(píng)分與功能注釋的整合
- 使用基因編輯驗(yàn)證 GWAS 發(fā)現(xiàn)
結(jié)論
引言
自身免疫入录、神經(jīng)退行性疾病和心血管疾病等常見(jiàn)的非傳染性疾病是當(dāng)今醫(yī)療保健中最緊迫的挑戰(zhàn)之一来涨。這些疾病受到遺傳易感性與環(huán)境或生活方式因素之間相互作用的影響。這些疾病受到數(shù)千種常見(jiàn)遺傳變異的額外貢獻(xiàn)的影響梅割,每種變異對(duì)表型的個(gè)體影響很小霜第。它們的遺傳結(jié)構(gòu)遵循多基因模型而非孟德?tīng)柲P停@使得研究復(fù)雜疾病具有挑戰(zhàn)性户辞。
盡管GWAS取得了成功泌类,但從其結(jié)果中得出的臨床見(jiàn)解仍然有限,這是由于難以解釋GWAS關(guān)聯(lián)底燎。解釋GWAS關(guān)聯(lián)的挑戰(zhàn)有以下三點(diǎn)(Fig 1):
(1)相鄰的遺傳變異通常彼此相關(guān)刃榨,因?yàn)樗鼈兺捎跍p數(shù)分裂重組過(guò)程中的共分離而遺傳在一起,這種現(xiàn)象被稱(chēng)為連鎖不平衡(LD)双仍。LD 導(dǎo)致一個(gè)基因座中的多個(gè)變異存在于同一個(gè)個(gè)體中枢希,由于存在很強(qiáng)的相關(guān)性,這使得很難得到真正casual的variants殊校。
(2)目前尚不清楚哪些細(xì)胞類(lèi)型是疾病的真正驅(qū)動(dòng)因素(即晴玖,哪些細(xì)胞類(lèi)型GWAS變異起作用),哪些是疾病致病過(guò)程的結(jié)果为流。
(3)超過(guò)90%的GWAS變異屬于基因組的非編碼區(qū)域呕屎,因此不會(huì)直接影響基因的編碼序列。這些變體在DNA調(diào)節(jié)元件(cRE)中的積累敬察,可能通過(guò)破壞轉(zhuǎn)錄因子結(jié)合位點(diǎn)(TFBS)在調(diào)節(jié)基因的表達(dá)水平起作用秀睛。然而,與疾病相關(guān)的基因座通常包含多個(gè)基因莲祸,因此很難區(qū)分受影響的基因座蹂安。
- 總之,有必要進(jìn)行后續(xù)研究來(lái)解釋GWAS結(jié)果锐帜,包括推斷確切的疾病致病變異田盈、它們調(diào)節(jié)的基因以及它們起作用的細(xì)胞類(lèi)型
在這里,我們回顧了一些促進(jìn)GWAS結(jié)果解釋的方法缴阎,重點(diǎn)關(guān)注SNP富集(SNP enrichment)和共定位(Colocalization)方法允瞧,并重點(diǎn)介紹了從這些研究中得出的一些生物學(xué)結(jié)論。有關(guān)精細(xì)映射(fine-mapping)的詳細(xì)方法,我們向讀者推薦以前的綜述(Schaid等人述暂,2018)痹升。最后,我們反思了后GWAS研究的一些挑戰(zhàn)和機(jī)遇畦韭,例如高通量單細(xì)胞測(cè)序平臺(tái)的可用性疼蛾,相關(guān)中間表型的鑒定,多基因風(fēng)險(xiǎn)評(píng)分(PRS)的開(kāi)發(fā)艺配,以及基因工程在GWAS驗(yàn)證中的系統(tǒng)應(yīng)用察郁。
Identifying Cell Types Relevant to Complex Diseases 識(shí)別與復(fù)雜疾病相關(guān)的細(xì)胞類(lèi)型【主要介紹SNP enrichment】
Snp Enrichment Analysis Based on Genome-Wide Significant Gwas Variants 基于全基因組顯著的Gwas變異的Snp富集分析
SNPsea方法指出,對(duì)于給定性狀妒挎,GWAS位點(diǎn)如果在給定細(xì)胞類(lèi)型中特異性表達(dá)的基因中被富集绳锅,則優(yōu)先考慮該細(xì)胞類(lèi)型。
GWAS變體可以與染色質(zhì)注釋相結(jié)合酝掩,例如開(kāi)放染色質(zhì)區(qū)域(ATAC-seq或DNase)鳞芙、組蛋白修飾(例如,H3K4me1期虾,H3K4me3原朝,H3K27ac和H3K27me3)、DNA甲基化等镶苞。與基因表達(dá)相反喳坠,染色質(zhì)標(biāo)記可以與GWAS SNP在物理上重疊,因此可以直接從位于注釋中的SNP中估計(jì)富集分析(Fig 2)茂蚓。ENCODE壕鹉、Roadmap Epigenomics、BLUEPRINT project等數(shù)據(jù)庫(kù)為這些SNP enrichment提供了豐富的資源聋涨。
接下來(lái)作者遞進(jìn)式地介紹了集中SNP enrichment的方法晾浴,包括:
- 二項(xiàng)檢驗(yàn)(Maurano等人,2012):將GWAS SNP與來(lái)自HapMap項(xiàng)目的一組常見(jiàn)SNP相比牍白,GWAS SNPs在DHS區(qū)域富集脊凰,且具有組織特異性。
- GREGOR(Schmidt等人茂腥,2015):將GWAS SNP與具有相似特性(即LD狸涌,基因密度和與TSS的距離)的隨機(jī)SNP集進(jìn)行比較,發(fā)現(xiàn)GWAS SNPs通常在活躍的調(diào)控區(qū)富集最岗。
- epiGWAS(Trenka等人帕胆,2013):考慮了峰內(nèi)SNP的位置和峰的高度
- GoShifter(Tlynka等人,2015):不受給定基因組區(qū)域中的高LD的影響
- Pasquali 等人分析了人類(lèi)胰島中的開(kāi)放染色質(zhì)般渡、TF 結(jié)合和基因表達(dá)惶楼,將這些特征與 GWAS 位點(diǎn)整合到 2 型糖尿病和空腹血糖中右蹦。作者使用基于排列的測(cè)試來(lái)估計(jì)富集,并得出結(jié)論歼捐,血糖和 2 型糖尿病 SNP 在胰島增強(qiáng)子中強(qiáng)烈富集,它們破壞了關(guān)鍵胰島 TF 的 DNA 結(jié)合晨汹。(https://www.nature.com/articles/ng.2870)
- CHEERS(Soskic等人豹储,2019):可以解釋染色質(zhì)景觀的細(xì)微變化,以識(shí)別跨細(xì)胞狀態(tài)的SNP富集(https://www.nature.com/articles/s41588-019-0493-9)
Genome-Wide Snp Enrichment Analysis 全基因組 Snp 富集分析
以上所描述的方法利用了來(lái)自全基因組顯著SNP的信號(hào)(Table 1)淘这。然而剥扣,復(fù)雜的性狀是由數(shù)千個(gè)風(fēng)險(xiǎn)等位基因引起的,大多數(shù)與性狀相關(guān)的SNP仍未被發(fā)現(xiàn)(Vischer 等人铝穷,2017 年)钠怯。因此,將分析限制在全基因組顯著的變異上可能會(huì)限制檢測(cè)生物學(xué)重要富集的統(tǒng)計(jì)能力曙聂。這促使許多方法的發(fā)展晦炊,這些方法使用所有常見(jiàn)的SNP來(lái)估計(jì)富集。
- fGWAS(Pickrell宁脊,2014):可以“重新權(quán)衡”并發(fā)現(xiàn)最初未達(dá)到全基因組意義的變異的關(guān)聯(lián)信號(hào)断国。
- GARFIELD(Iotchkova 等人,2019 年):將每個(gè) SNP 的性狀關(guān)聯(lián)狀態(tài)建模為概率榆苞,定義為變體特征的函數(shù)(即稳衬,與功能注釋重疊、到最近的 TSS 的距離和 LD 代理的數(shù)量)坐漏,從而允許在計(jì)算中包含更多的SNP薄疚。
Enrichment Analysis Based on Snp Heritability 基于Snp遺傳力的富集分析
遺傳力是由于遺傳變異導(dǎo)致的性狀變異的比例。SNP遺傳力是由一組給定的SNP解釋的表型變異量赊琳。 已經(jīng)開(kāi)發(fā)了許多方法來(lái)估計(jì)性狀的SNP遺傳力街夭,使用個(gè)體水平的基因型或來(lái)自GWAS的匯總統(tǒng)計(jì)
LDSC(Finucane等人,2015):如果GWAS變體在功能類(lèi)別中富集慨畸,那么屬于該類(lèi)別的變體將比其他變體解釋更多的性狀遺傳力莱坎。作者發(fā)現(xiàn),基因組的保守區(qū)域解釋了更多的遺傳力寸士。此外檐什,針對(duì)疾病相關(guān)細(xì)胞類(lèi)型的增強(qiáng)子內(nèi)的變異也解釋了很大一部分遺傳力。
LDSC-SEG(Finucane等人弱卡,2018):LDSC方法的一個(gè)局限性是它依賴(lài)于染色質(zhì)活性譜乃正,而染色質(zhì)活性譜并不總是可用的。相比之下婶博,基因表達(dá)譜可用于更多數(shù)量的細(xì)胞類(lèi)型瓮具,包括豐度較低的細(xì)胞類(lèi)型。LDSC-SEG利用基因表達(dá)譜來(lái)推斷細(xì)胞特異性的SNP富集。
RolyPoly(Calderon等人名党,2017):具有較高GWAS效應(yīng)大小的變異往往接近在致病組織中表達(dá)較高的基因叹阔。使用回歸模型,RolyPoly 估計(jì)細(xì)胞類(lèi)型特異性基因表達(dá)對(duì)每個(gè)組織中 GWAS 效應(yīng)大小方差的影響传睹。
Prioritizing Causal Genes at GWAS Loci 優(yōu)先考慮GWAS位點(diǎn)的致病基因【Colocalization】
一旦確定了最相關(guān)的細(xì)胞類(lèi)型耳幢,下一步就是優(yōu)先考慮與疾病有因果關(guān)系的基因。對(duì)于編碼變異欧啤,候選基因的鑒定最直接睛藻,因?yàn)樽儺悤?huì)直接破壞蛋白質(zhì)的結(jié)構(gòu)。
然而邢隧,GWAS鑒定的90%的變異是非編碼的店印。這些變異被認(rèn)為通過(guò)修飾啟動(dòng)子和增強(qiáng)子活性或破壞TF的結(jié)合位點(diǎn)等機(jī)制來(lái)調(diào)節(jié)基因表達(dá)。一個(gè)例子是 1q13 位點(diǎn)倒慧,它包含與低密度脂蛋白膽固醇水平和心肌梗死顯著相關(guān)的變異按摘。該變體被證明產(chǎn)生一個(gè)新的TF結(jié)合位點(diǎn),這反過(guò)來(lái)又導(dǎo)致增強(qiáng)子結(jié)合蛋白的募集迫靖,急劇增加附近基因SORT1的表達(dá)院峡。反過(guò)來(lái),SORT1 會(huì)下調(diào)低密度脂蛋白的水平系宜。這使得 SORT1 成為心肌梗死中一個(gè)有趣的藥物靶點(diǎn)照激。
大多數(shù)與疾病相關(guān)的變異被認(rèn)為通過(guò)類(lèi)似于 SORT1 位點(diǎn)的機(jī)制起作用。然而盹牧,GWAS基因座通常包含多個(gè)基因俩垃,識(shí)別致病基因具有挑戰(zhàn)性。分析分子性狀(例如汰寓,基因表達(dá)口柳、DNA 甲基化、TF 結(jié)合)并將其與 GWAS 結(jié)果相結(jié)合有滑,有助于將非編碼變異與其靶基因聯(lián)系起來(lái)并揭示潛在的調(diào)控事件跃闹。
Colocalization Analysis 共定位分析
分子性狀的量化,例如數(shù)千個(gè)具有不同基因型的個(gè)體的基因表達(dá)毛好,使遺傳變異與中間性狀(數(shù)量性狀位點(diǎn)定位望艺,QTL)相關(guān)聯(lián)(Fig3A)
高通量測(cè)序成本的降低導(dǎo)致了數(shù)十項(xiàng)QTL定位研究找默,包括基因表達(dá)(eQTLs)、蛋白質(zhì)表達(dá)(pQTLs)吼驶,外顯子剪接(sQTL)惩激、DNA甲基化(mQTLs)店煞、染色質(zhì)乙酰化(acQTLs)和染色質(zhì)可及性 (caQTL)风钻。其中顷蟀,eQTL是最常見(jiàn)的,部分原因是RNA測(cè)序技術(shù)的穩(wěn)健性骡技。最全面的 eQTL 資源之一是基因型組織表達(dá)項(xiàng)目 (GTEx)衩椒,該項(xiàng)目分析了近 1,000 個(gè)個(gè)體的 53 個(gè)組織。另一項(xiàng)舉措是BLUEPRINT項(xiàng)目哮兰,測(cè)量了197個(gè)個(gè)體外周血中最豐富的細(xì)胞類(lèi)型的轉(zhuǎn)錄組,以及DNA甲基化和組蛋白修飾苟弛。
將QTL圖譜與GWAS相結(jié)合可以識(shí)別疾病關(guān)聯(lián)的潛在分子機(jī)制喝滞。這方面的早期例子只是評(píng)估GWAS變異是否也是重要的eQTL。Nicolae等人(2010)的一項(xiàng)研究將GWAS結(jié)果與來(lái)自人類(lèi)淋巴母細(xì)胞樣細(xì)胞系的eQTL相結(jié)合膏秫,得出的結(jié)論是GWAS SNPs成為eQTLs的可能性幾乎是隨機(jī)SNP集的兩倍右遭。
然而,這些早期方法沒(méi)有充分控制GWAS和eQTL信號(hào)背后的遺傳結(jié)構(gòu)缤削,導(dǎo)致大量假陽(yáng)性結(jié)果窘哈。特別是,SNP之間的連鎖不平衡使得確定GWAS和QTL位點(diǎn)中的哪些變異在因果關(guān)系上驅(qū)動(dòng)關(guān)聯(lián)變得具有挑戰(zhàn)性亭敢。重疊的eQTL和GWAS信號(hào)可以用三種可能的情況來(lái)解釋?zhuān)‵ig3C):(1)LD中兩個(gè)獨(dú)立的因果SNP相互之間(連鎖)滚婉,(2)通過(guò)調(diào)節(jié)基因表達(dá)(因果關(guān)系)來(lái)影響性狀的單因果SNP,或(3)對(duì)性狀和基因表達(dá)有獨(dú)立影響的單因果SNP(多效性)帅刀。區(qū)分這些情況對(duì)于正確解釋GWAS結(jié)果至關(guān)重要让腹。
此外,eQTL是豐富的扣溺,估計(jì)有48%的常見(jiàn)遺傳變異充當(dāng)至少一個(gè)基因的eQTL骇窍,這使得GWAS和eQTL信號(hào)之間的重疊可能是偶然發(fā)生的。這促使了正式統(tǒng)計(jì)測(cè)試的發(fā)展锥余,這些測(cè)試估計(jì)兩個(gè)信號(hào)之間由于偶然性而重疊的概率腹纳。這些方法稱(chēng)為共定位測(cè)試。(Table2)
RTC(Nica等人驱犹,2010):首先識(shí)別具有潛在共定位的位點(diǎn)嘲恍,然后從eQTL效應(yīng)中回歸,即位點(diǎn)中最重要的GWAS SNP着绷。然后使用回歸殘差重新測(cè)試eQTL關(guān)聯(lián)蛔钙。為了解釋該區(qū)域的LD,對(duì)該區(qū)域的所有SNP重復(fù)該過(guò)程荠医,并將頂級(jí)GWAS SNP的影響與其他變體的影響進(jìn)行比較吁脱。在存在真正的共定位的情況下桑涎,頂級(jí)GWAS SNP的回歸系數(shù)的影響明顯大于該區(qū)域任何其他變體的影響。
COLOC(Giambartolomei等人兼贡,2014):共定位檢驗(yàn):使用GWAS匯總統(tǒng)計(jì)量計(jì)算與原假設(shè)相比共定位的幾率攻冷。自發(fā)布以來(lái),COLOC已成為共定位測(cè)試的參考方法遍希。
MOLOC(Giambartolomei 等人等曼,2018 年):COLOC的一個(gè)局限性是它一次只能測(cè)試兩個(gè)特征。MOLOC 擴(kuò)展了 COLOC 的原始配方以包括多種性狀凿蒜,這些性狀可以是獨(dú)立的GWAS禁谦、分子性狀或兩者的組合。
eCAVIAR (Hormozdiari等人废封,2016):精細(xì)映射可以獨(dú)立應(yīng)用于GWAS和QTL關(guān)聯(lián)州泊,然后進(jìn)行整合。eCAVIAR可以擴(kuò)展為在任意數(shù)量的因果SNP的假設(shè)下找到共定位漂洋,同時(shí)考慮LD遥皂。
ENLOC(Wen等人,2017):如果一個(gè)性狀的大多數(shù)GWAS SNP也是給定細(xì)胞類(lèi)型中的eQTL(即刽漂,如果GWAS SNP在eQTL中富集)演训,那么兩個(gè)性狀之間的大多數(shù)重疊將由真正的共定位驅(qū)動(dòng)。相反贝咙,如果GWAS SNPs沒(méi)有在該細(xì)胞類(lèi)型的eQTL中富集样悟,則更多的重疊預(yù)計(jì)是偶然的。
最后颈畸,GWAS變異的影響并不局限于鄰近的基因乌奇,并且可能產(chǎn)生更多的遠(yuǎn)端效應(yīng)(反式eQTL)。例如眯娱,GWAS變體可能會(huì)影響TF的表達(dá)礁苗,從而對(duì)下游基因產(chǎn)生連鎖反應(yīng)。反式 eQTL 遠(yuǎn)離其靶基因徙缴,并且往往具有較小的效應(yīng)量试伙,這使得它們?cè)谥械葮颖玖肯吕L制圖譜極具挑戰(zhàn)性。此外于样,據(jù)估計(jì)疏叨,反式 eQTL 的數(shù)量遠(yuǎn)多于順式 eQTL,可能導(dǎo)致許多假陽(yáng)性共定位穿剖≡槁基因表達(dá)研究的樣本量不斷增加,使我們能夠系統(tǒng)地繪制反式eQTL糊余,并將提供更多的統(tǒng)計(jì)能力來(lái)檢測(cè)GWAS和反式eQTL之間有意義的共定位秀又。
Application of Colocalization to Complex Diseases 共定位在復(fù)雜疾病中的應(yīng)用
共定位分析特別有用的領(lǐng)域之一是確定免疫介導(dǎo)疾病的潛在機(jī)制单寂。。吐辙。宣决。。昏苏。尊沸。
共定位還指出了與這些疾病有關(guān)的基因和功能元件。贤惯。洼专。。孵构。壶熏。
共定位的另一個(gè)特別有用的領(lǐng)域是心血管疾病。浦译。。溯职。精盅。。谜酒。
最后叹俏,共定位分析還可以為復(fù)雜性狀中共享遺傳結(jié)構(gòu)之間的關(guān)系提供信息。僻族。粘驰。。述么。
Twas: Direct Association of Genes and Traits Twas:基因和性狀的直接關(guān)聯(lián)
全轉(zhuǎn)錄組關(guān)聯(lián)研究(TWAS)利用來(lái)自 GWAS 和 eQTL 目錄的信息來(lái)預(yù)測(cè)病例和對(duì)照的轉(zhuǎn)錄組蝌数,從而允許性狀和基因的直接關(guān)聯(lián),而無(wú)需直接分析 GWAS 中包含的每個(gè)個(gè)體的基因表達(dá)度秘。
基于基因型預(yù)測(cè)基因表達(dá)是可能的顶伞,因?yàn)榛虮磉_(dá)具有高度可遺傳性,并且大多數(shù)基因表達(dá)遺傳性可歸因于與基因接近(順式)的變異剑梳。TWAS使用組織特異性eQTL圖譜作為參考數(shù)據(jù)集來(lái)訓(xùn)練預(yù)測(cè)器唆貌,這些預(yù)測(cè)器將個(gè)體的基因型作為輸入,并估計(jì)其轉(zhuǎn)錄組水平(圖4A)垢乙。這些預(yù)測(cè)器僅使用來(lái)自順式 SNP 到基因的信息锨咙,并且僅限于具有高度可遺傳表達(dá)的基因。該預(yù)測(cè)過(guò)程類(lèi)似于基因型插補(bǔ)追逮,并允許性狀與每個(gè)基因的表達(dá)之間直接關(guān)聯(lián)(圖4B)酪刀。此外粹舵,通過(guò)關(guān)注基因表達(dá)的可遺傳成分,它最大限度地減少了疾病引起的基因表達(dá)變化的混淆蓖宦。
PrediXcan(Gamazon等人齐婴,2015)是TWAS的實(shí)現(xiàn),它使用彈性網(wǎng)絡(luò)模型來(lái)預(yù)測(cè)eQTL目錄中的基因表達(dá)稠茂。它可以發(fā)現(xiàn)與復(fù)雜疾病相關(guān)的基因柠偶。這些基因中的大多數(shù)是GWAS的已知候選基因,同時(shí)也有以前沒(méi)有發(fā)現(xiàn)的基因睬关。重要的是诱担,由于TWAS直接將性狀與基因相關(guān)聯(lián),因此這些關(guān)聯(lián)具有明確的效果方向性电爹。
EpiXcan(Zhang 等人蔫仙,2019 )考慮了 DNA 甲基化或組蛋白修飾等注釋?zhuān)總€(gè)SNP在預(yù)測(cè)中的貢獻(xiàn)由其與貝葉斯分層模型中的調(diào)控元素的重疊進(jìn)行加權(quán)。當(dāng)應(yīng)用于 58 個(gè)性狀和 14 個(gè) eQTL 數(shù)據(jù)集時(shí)丐箩,與 PrediXcan 相比摇邦,EpiXcan 的基因-性狀關(guān)聯(lián)數(shù)量增加了 18% 以上。這些關(guān)聯(lián)大多是組織特異性的屎勘。
總之施籍,共定位和TWAS優(yōu)先考慮與復(fù)雜疾病有因果關(guān)系的基因。共定位分析將來(lái)自 GWAS 和 QTL 的關(guān)聯(lián)信號(hào)整合到一個(gè)位點(diǎn)的基礎(chǔ)上概漱,以識(shí)別兩個(gè)性狀共享因果變異的實(shí)例丑慎。相比之下,TWAS利用eQTL目錄中的信息來(lái)推斷基因表達(dá)值瓤摧,并將基因與性狀直接關(guān)聯(lián)竿裂。來(lái)自更多細(xì)胞類(lèi)型以及更大樣本量的QTL目錄的可用性將改善基因優(yōu)先級(jí),并將GWAS結(jié)果轉(zhuǎn)化為精細(xì)的疾病致病基因集照弥。
Future Perspectives in Interpreting GWAS Associations 解釋GWAS關(guān)聯(lián)的未來(lái)前景
富集和共定位分析優(yōu)先考慮與復(fù)雜疾病有關(guān)的組織和基因腻异。然而,這些方法在很大程度上受到綜合參考功能數(shù)據(jù)集的可用性的限制这揣。例如捂掰,富集和共定位主要依賴(lài)于來(lái)自bulk的基因表達(dá)數(shù)據(jù)。然而曾沈,來(lái)自大塊組織的基因表達(dá)譜以最豐富的細(xì)胞類(lèi)型為主这嚣,并且不捕獲有關(guān)細(xì)胞組成和細(xì)胞類(lèi)型頻率的信息。此外塞俱,共定位方法純粹是觀察性的姐帚,不能建立因果關(guān)系。例如障涯,SNP可以通過(guò)獨(dú)立的機(jī)制(即多效性)影響基因和性狀罐旗,而共定位無(wú)法最終將這種情況與單一的因果變異區(qū)分開(kāi)來(lái)膳汪。因此,候選基因需要額外的實(shí)驗(yàn)驗(yàn)證才能明確地建立因果關(guān)系九秀,例如遗嗽,通過(guò)將GWAS變體與單細(xì)胞檢測(cè)相結(jié)合,或使用基因編輯技術(shù)驗(yàn)證候選基因鼓蜒。
Integration of Gwas With Single-Cell Genomics GWAS與單細(xì)胞基因組學(xué)的整合
單細(xì)胞基因組圖譜的高分辨率使其成為SNP富集分析的有前途的資源痹换。g-chromVAR將精細(xì)映射的GWAS變體與bulk和單細(xì)胞造血細(xì)胞和祖細(xì)胞譜系的染色質(zhì)可及性譜集成在一起。將每個(gè)單細(xì)胞中染色質(zhì)可及性的定量水平與從精細(xì)映射推斷的每個(gè)變異的因果關(guān)系的后驗(yàn)概率相結(jié)合都弹。富集估計(jì)值在整個(gè)分化軌跡中各不相同娇豫,并集中在造血的特定階段。例如畅厢,隨著細(xì)胞分化為巨核細(xì)胞(血小板的前體)冯痢,與血小板計(jì)數(shù)相關(guān)的變異逐漸富集。相反框杜,富集隨著向淋巴譜系的分化而減少浦楣。
單細(xì)胞技術(shù)還可以擴(kuò)大目前的共定位范圍。由于這些檢測(cè)的通量正在以前所未有的規(guī)模增長(zhǎng)咪辱,現(xiàn)在可以在大規(guī)模個(gè)體群體中分析單細(xì)胞轉(zhuǎn)錄組椒振,從而可以繪制單細(xì)胞 eQTL (sc-eQTL)。其中一項(xiàng)研究分析了從 45 名健康個(gè)體的外周血中分離的 45,000 個(gè)單細(xì)胞中的基因表達(dá)梧乘,并確定了在血液中不同細(xì)胞類(lèi)型中具有相反作用的 eQTL。例如庐杨,rs4804315 增加了 NK 細(xì)胞中 ZNF414 的表達(dá)选调,但在 T 細(xì)胞中降低了 ZNF414 的表達(dá)。此外灵份,作者還總結(jié)了先前報(bào)道的HLA-DQA1和CTSC基因的兩個(gè)單核細(xì)胞eQTL仁堪,并表明它們對(duì)經(jīng)典單核細(xì)胞亞群具有特異性。這些結(jié)果很難從批量基因表達(dá)測(cè)量中獲得填渠。這項(xiàng)研究可以作為概念驗(yàn)證弦聂,并展示了單細(xì)胞eQTL關(guān)聯(lián)如何迅速與GWAS整合。
單細(xì)胞測(cè)序的另一個(gè)優(yōu)點(diǎn)是可以將細(xì)胞排序到時(shí)間進(jìn)程軌跡中氛什,從而為用于eQTL映射的關(guān)聯(lián)模型添加時(shí)間分量莺葫。這允許在不同的分化階段鑒定具有不同效應(yīng)大小的eQTL(動(dòng)態(tài)eQTL)。兩項(xiàng)研究繪制了人類(lèi)誘導(dǎo)多能干細(xì)胞(iPSCs)分化過(guò)程中的動(dòng)態(tài)eQTL枪眉。
Integration of Polygenic Risk Scores With Functional Annotations 多基因風(fēng)險(xiǎn)評(píng)分與功能注釋的整合
全基因組關(guān)聯(lián)研究變異可用于識(shí)別疾病高危個(gè)體捺檬。這可以通過(guò)將個(gè)體攜帶的數(shù)百種疾病相關(guān)變異組合成一個(gè)反映其整體遺傳風(fēng)險(xiǎn)的單一評(píng)分來(lái)實(shí)現(xiàn),即多基因風(fēng)險(xiǎn)評(píng)分(PRS)贸铜。將 PRS 與流行病學(xué)風(fēng)險(xiǎn)因素(如年齡堡纬、性別聂受、吸煙狀況、飲食或疾病家族史)相結(jié)合可以改善個(gè)體的分層烤镐,從而可能導(dǎo)致更有效的臨床干預(yù)蛋济。隨著GWAS研究樣本量的增加和更大的驗(yàn)證隊(duì)列的出現(xiàn),多基因風(fēng)險(xiǎn)評(píng)分的性能有所提高炮叶。
盡管取得了這些進(jìn)展碗旅,但多基因評(píng)分仍面臨嚴(yán)峻的挑戰(zhàn)。首先悴灵,預(yù)測(cè)精度仍然很低扛芽。其次,PRS 基于歐洲 GWAS积瞒,其在人群之間的可轉(zhuǎn)移性較低川尖。最后,人們對(duì)PRS的功能機(jī)制知之甚少茫孔。其中一些挑戰(zhàn)現(xiàn)在正在使用功能注釋來(lái)解決叮喳。
Validation of Gwas Findings Using Gene Editing 使用基因編輯驗(yàn)證 GWAS 發(fā)現(xiàn)
將CRISPR編輯平臺(tái)與信息豐富的功能讀數(shù)相結(jié)合可能是驗(yàn)證GWAS結(jié)果的有力方法。
基因編輯方法也可用于研究非編碼基因組缰贝。例如馍悟,CRISPR干擾(CRISPRi)使用引導(dǎo)RNA和Cas9酶的缺陷版本來(lái)防止調(diào)節(jié)元件接觸其靶基因。相反剩晴,CRISPR激活(CRISPRa)使用與Cas9蛋白融合的轉(zhuǎn)錄激活因子來(lái)增強(qiáng)轉(zhuǎn)錄锣咒。這些工具可用于繪制疾病相關(guān)調(diào)節(jié)元件的功能。
理想情況下赞弥,基因編輯應(yīng)在與疾病相關(guān)的細(xì)胞類(lèi)型中進(jìn)行(例如毅整,在SNP富集優(yōu)先的細(xì)胞中)。然而绽左,目前的基因編輯方法大多局限于細(xì)胞系悼嫉。需要進(jìn)一步的技術(shù)發(fā)展來(lái)常規(guī)應(yīng)用基因編輯作為GWAS的后續(xù)策略。
結(jié)論
GWAS關(guān)聯(lián)與細(xì)胞類(lèi)型特異性功能數(shù)據(jù)的整合極大地促進(jìn)了我們對(duì)遺傳變異如何導(dǎo)致疾病的理解拼窥。一方面戏蔑,SNP富集方法能夠根據(jù)細(xì)胞類(lèi)型和組織的疾病相關(guān)性對(duì)細(xì)胞類(lèi)型和組織進(jìn)行優(yōu)先級(jí)排序。這些方法通過(guò)測(cè)試特定細(xì)胞類(lèi)型特有的調(diào)節(jié)元件中變異的積累來(lái)起作用鲁纠。它們可以限制在全基因組顯著變異上总棵,也可以根據(jù)所有常見(jiàn)SNP的貢獻(xiàn)來(lái)估計(jì)富集。另一方面改含,共定位分析整合了eQTL和GWAS關(guān)聯(lián)彻舰,利用LD信息和關(guān)聯(lián)模式來(lái)鑒定GWAS位點(diǎn)的靶基因。此外,TWAS允許通過(guò)轉(zhuǎn)錄組插補(bǔ)將基因與表型直接關(guān)聯(lián)刃唤。這些方法開(kāi)始揭示受自身免疫隔心、精神分裂癥和冠心病等復(fù)雜疾病影響的組織和基因。然而尚胞,它們受到當(dāng)前功能數(shù)據(jù)集分辨率的限制硬霍,無(wú)法建立因果關(guān)系。未來(lái)笼裳,我們預(yù)計(jì)GWAS與單細(xì)胞數(shù)據(jù)的整合以及通過(guò)基因編輯和細(xì)胞表型驗(yàn)證候選基因?qū)椭覀儗WAS研究結(jié)果轉(zhuǎn)化為臨床上可操作的基因集唯卖。
原文鏈接
https://www.frontiersin.org/articles/10.3389/fgene.2020.00424/full