引言
GWAS與eQTL都是用于研究基因位點(diǎn)與表型之間關(guān)系的手段墅诡,彼此之間存在很多的區(qū)別與聯(lián)系末早。
GWAS
全基因組關(guān)聯(lián)分析(Genome Wide Association Study说庭,GWAS)是指在全基因組層面上,開展多中心姿搜、大樣本捆憎、反復(fù)驗(yàn)證的基因與疾病的關(guān)聯(lián)研究,是通過(guò)對(duì)大規(guī)模的群體DNA樣本進(jìn)行全基因組高密度遺傳標(biāo)記(如SNP或CNV等)分型致份,進(jìn)而將基因型與可觀測(cè)的性狀氮块,即表型诡宗,進(jìn)行群體水平的統(tǒng)計(jì)學(xué)分析,根據(jù)統(tǒng)計(jì)量或顯著性 p 值篩選出最有可能影響該性狀的遺傳變異(標(biāo)記)蝠引,全面揭示疾病發(fā)生芳悲、發(fā)展與治療相關(guān)的遺傳基因名扛。
什么是SNP?
進(jìn)化過(guò)程中隨機(jī)產(chǎn)生的單點(diǎn)突變肮韧,并能穩(wěn)定的在群體中遺傳。
什么是allele frequency in population超燃?
每一個(gè)genome位點(diǎn)都有兩個(gè)或多個(gè)allele意乓,不同allele之間有明顯的頻率上的差異,簡(jiǎn)單點(diǎn)理解就是A和a兩個(gè)性質(zhì)的頻率笆凌,但這里是堿基位點(diǎn)士葫,而不是性狀基因。
GWAS分析的前提
sample size足夠爪模,學(xué)過(guò)統(tǒng)計(jì)的都知道sample size會(huì)影響power屋灌,沒有足夠的power是得不出正確結(jié)論的鞋喇,GWAS通常需要大量的樣本,幾千是標(biāo)配,幾百就太少罐韩,現(xiàn)在有的都達(dá)到了幾萬(wàn)幾十萬(wàn)級(jí)別污朽。
一個(gè)大誤區(qū)就是GWAS會(huì)測(cè)全基因組WGS蟆肆,其實(shí)不是的,那太貴了炎功,大部分是做DNA chip DNA芯片(專業(yè)的叫SNP array)蛇损,只包含了常見的10^6個(gè)SNP坛怪。稍微有錢的就會(huì)上WES袜匿,就會(huì)得到所有編碼區(qū)的SNP稚疹;最有錢的就是WGS了,全部檢測(cè)怪嫌,編碼非編碼其屏,常見罕見,1000genome就是靠這個(gè)才NB的川背。
而在GWAS分析結(jié)果中蛤袒,大部分顯著的SNP位點(diǎn)都位于非編碼區(qū)妙真,很難直接挖掘這些位點(diǎn)的調(diào)控機(jī)制。通常假設(shè)與疾病關(guān)聯(lián)的SNP位點(diǎn)通過(guò)調(diào)控基因表達(dá)來(lái)發(fā)揮作用练般,而eQTL可以識(shí)別SNP與基因間的調(diào)控關(guān)系锈候,將eQTL和GWAS結(jié)果相結(jié)合泵琳,可以進(jìn)一步篩選候選基因获列。
eQTL
eQTL,即表達(dá)數(shù)量性狀基因座(expression Quantitative Trait Loci)迫悠,比如身高是一個(gè)數(shù)量性狀及皂,其對(duì)應(yīng)的控制基因的位點(diǎn)就是一個(gè)數(shù)量性狀基因,而eQTL就是能控制數(shù)量性狀基因(如身高基因)表達(dá)水平高低的那些位點(diǎn)验烧。
eQTL可分為順式作用eQTL(cis-eQTL)和反式作用eQTL(trans-eQTL)碍拆,順式作用eQTL就是某個(gè)基因的eQTL定位到該基因所在的基因組區(qū)域感混,表明可能是該基因本身的差別引起的mRNA水平變化;反式作用eQTL是指某個(gè)基因的eQTL定位到其他基因組區(qū)域婆跑,表明其他基因的差別控制該基因mRNA水平的差異滑进。
eQTL就是把基因表達(dá)作為一種性狀募谎,研究遺傳突變與基因表達(dá)的相關(guān)性:就好像研究遺傳突變與身高的相關(guān)性一樣。簡(jiǎn)單地說(shuō)节槐,遺傳學(xué)研究經(jīng)常發(fā)現(xiàn)一些致病或易感突變, 這些突變?cè)鯓訉?dǎo)致表型有時(shí)候不太直觀铜异;所以用某個(gè)基因的差異表達(dá)作為過(guò)渡:突變A->B基因表達(dá)變化->表型秸架。
簡(jiǎn)單來(lái)講咕宿,我們首先通過(guò)全基因組測(cè)序獲得每個(gè)個(gè)體的DNA全序府阀,然后以同種族的其他個(gè)體作為參照试浙,標(biāo)記出該個(gè)體所有的DNA變異位點(diǎn)田巴, 稱為SNP位點(diǎn)。同時(shí)壹哺,我們通過(guò)全基因組mRNA表達(dá)量測(cè)序得到該個(gè)體的特定組織樣本中的基因表達(dá)量管宵。以全部DNA變異位點(diǎn)為自變量箩朴,輪流以每種mRNA表達(dá)量為因變量炸庞,用大量的個(gè)體數(shù)據(jù)做樣本進(jìn)行線性回歸埠居,就可以得到每一個(gè)SNP位點(diǎn)和每一個(gè)mRNA表達(dá)量之間的關(guān)系拐格。
GTEx
GTEx(Genotype-Tissue Expression)是第一個(gè)收集了多個(gè)人體器官mRNA測(cè)序的數(shù)據(jù)庫(kù)捏浊,并提供了跨器官的eQTL研究平臺(tái)。研究從來(lái)自449名生前健康的人類捐贈(zèng)者的7000多份尸檢樣本浊洞,涵蓋44個(gè)組織(42個(gè)不同的組織類型)法希,包括31個(gè)實(shí)體器官組織苫亦、10個(gè)腦分區(qū)怨咪、全血诗眨、2個(gè)來(lái)自捐贈(zèng)者血液和皮膚的細(xì)胞系匠楚,作者利用這些樣本研究基因表達(dá)在不同組織和個(gè)體中有何差異巍膘。
GWAS和eQTL的聯(lián)合分析
參考
http://www.reibang.com/p/acdc4a22e30a