全基因組關(guān)聯(lián)分析是一種在人類或動(dòng)植物全基因組中尋找變異序列的方法匾南,全英文名為Genome-wide association study啃匿,縮寫(xiě)名為GWAS。 2005年蛆楞,Science雜志報(bào)道了第一篇GWAS研究——年齡相關(guān)性黃斑變性溯乒,之后陸續(xù)出現(xiàn)了有關(guān)冠心病、肥胖豹爹、2型糖尿病裆悄、甘油三酯、精神分裂癥等的研究報(bào)道臂聋。截至2010年底光稼,單是在人類上就有1212篇GWAS文章被發(fā)表,涉及210個(gè)性狀孩等。GWAS主要基于共變法的思想艾君,該方法是人類進(jìn)行科學(xué)思維和實(shí)踐的最重要工具之一;統(tǒng)計(jì)學(xué)研究也表明肄方,GWAS很長(zhǎng)時(shí)期內(nèi)都將處于蓬勃發(fā)展期冰垄。
全基因組序列分析的原理
全基因組關(guān)聯(lián)分析(Genome-wide association study;GWAS)是應(yīng)用基因組中數(shù)以百萬(wàn)計(jì)的單核苷酸多態(tài)性(single nucleotide ploymorphism,SNP)為分子遺傳標(biāo)記权她,進(jìn)行全基因組水平上的對(duì)照分析或相關(guān)性分析虹茶,通過(guò)比較發(fā)現(xiàn)影響復(fù)雜性狀的基因變異的一種新策略。
隨著基因組學(xué)研究以及基因芯片技術(shù)的發(fā)展隅要,人們已通過(guò)GWAS方法發(fā)現(xiàn)并鑒定了大量與復(fù)雜性狀相關(guān)聯(lián)的遺傳變異写烤。近年來(lái),這種方法在農(nóng)業(yè)動(dòng)物重要經(jīng)濟(jì)性狀主效基因的篩查和鑒定中得到了應(yīng)用拾徙。
全基因組關(guān)聯(lián)方法首先在人類醫(yī)學(xué)領(lǐng)域的研究中得到了極大的重視和應(yīng)用洲炊,尤其是其在復(fù)雜疾病研究領(lǐng)域中的應(yīng)用,使許多重要的復(fù)雜疾病的研究取得了突破性進(jìn)展尼啡,因而暂衡,全基因組關(guān)聯(lián)分析研究方法的設(shè)計(jì)原理得到重視。
人類的疾病分為單基因疾病和復(fù)雜性疾病崖瞭。單基因疾病是指由于單個(gè)基因的突變導(dǎo)致的疾病狂巢,通過(guò)家系連鎖分析的定位克隆方法,人們已發(fā)現(xiàn)了囊性纖維化书聚、亨廷頓病等大量單基因疾病的致病基因唧领,這些單基因的突變改變了相應(yīng)的編碼蛋白氨基酸序列或者產(chǎn)量藻雌,從而產(chǎn)生了符合孟德?tīng)栠z傳方式的疾病表型。復(fù)雜性疾病是指由于遺傳和環(huán)境因素的共同作用引起的疾病斩个。目前已經(jīng)鑒定出的與人類復(fù)雜性疾病相關(guān)聯(lián)的SNP位點(diǎn)有439個(gè)胯杭。全基因組關(guān)聯(lián)分析技術(shù)的重大革新及其應(yīng)用,極大地推動(dòng)了基因組醫(yī)學(xué)的發(fā)展受啥。
動(dòng)物重要經(jīng)濟(jì)性狀即復(fù)雜性狀GWAS分析方法的原理是做个,借助于SNP分子遺傳標(biāo)記,進(jìn)行總體關(guān)聯(lián)分析滚局,在全基因組范圍內(nèi)選擇遺傳變異進(jìn)行基因分型居暖,比較異常和對(duì)照組之間每個(gè)遺傳變異及其頻率的差異,統(tǒng)計(jì)分析每個(gè)變異與目標(biāo)性狀之間的關(guān)聯(lián)性大小藤肢,選出最相關(guān)的遺傳變異進(jìn)行驗(yàn)證太闺,并根據(jù)驗(yàn)證結(jié)果最終確認(rèn)其與目標(biāo)性狀之間的相關(guān)性。
GWAS的具體研究方法與傳統(tǒng)的候選基因法相類似嘁圈。最早主要是用單階段方法跟束,即選擇足夠多的樣本,一次性地在所有研究對(duì)象中對(duì)目標(biāo)SNP進(jìn)行基因分型丑孩,然后分析每個(gè)SNP與目標(biāo)性狀的關(guān)聯(lián),統(tǒng)計(jì)分析關(guān)聯(lián)強(qiáng)度灭贷。
目前GWAS研究主要采用兩階段或多階段方法温学。在第一階段用覆蓋全基因組范圍的SNP進(jìn)行對(duì)照分析,統(tǒng)計(jì)分析后篩選出較少數(shù)量的陽(yáng)性SNP進(jìn)行第二階段或隨后的多階段中采用更大樣本的對(duì)照樣本群進(jìn)行基因分型甚疟,然后結(jié)合兩階段或多階段的結(jié)果進(jìn)行分析仗岖。這種設(shè)計(jì)需要保證第一階段篩選與目標(biāo)性狀相關(guān)SNP的敏感性和特異性,盡量減少分析的假陽(yáng)性或假陰性览妖,并在第二階段應(yīng)用大量樣本群進(jìn)行基因分型驗(yàn)證轧拄。雖然 GWAS結(jié)果在很大程度上增加了對(duì)復(fù)雜性狀分子遺傳機(jī)制的理解,但也顯現(xiàn)出很大的局限性。首先讽膏,通過(guò)統(tǒng)計(jì)分析遺傳因素和復(fù)雜性狀的關(guān)系,確定與特定復(fù)雜性狀關(guān)聯(lián)的功能性位點(diǎn)存在一定難度檩电。通過(guò)GWAS發(fā)現(xiàn)的許多SNP位點(diǎn)并不影響蛋白質(zhì)中的氨基酸,甚至許多SNP位點(diǎn)不在蛋白編碼開(kāi)放閱讀框(open reading frame,ORF)內(nèi),這為解釋 SNP位點(diǎn)與復(fù)雜性狀之間的關(guān)系造成了困難。
但是府树,由于復(fù)雜性狀很大程度上是由數(shù)量性狀的微效多基因決定的,SNP位點(diǎn)可能通過(guò)影響基因表達(dá)量對(duì)這些數(shù)量性狀產(chǎn)生輕微的作用俐末,它們?cè)赗NA的轉(zhuǎn)錄或翻譯效率上發(fā)揮作用,可能在基因表達(dá)上產(chǎn)生短暫的或依賴時(shí)空的多種影響奄侠,刺激調(diào)節(jié)基因的轉(zhuǎn)錄表達(dá)或影響其RNA剪接方式卓箫。因此,在找尋相關(guān)變異時(shí)應(yīng)同時(shí)注意到編碼區(qū)和調(diào)控區(qū)位點(diǎn)變異的重要性垄潮。其次烹卒,等位基因結(jié)構(gòu) (數(shù)量闷盔、類型、作用大小和易感性變異頻率)在不同性狀中可能具有不同的特征旅急。
在GWAS研究后要確定一個(gè)基因型-表型因果關(guān)系還有許多困難逢勾,由于連鎖不平衡的原因,相鄰的SNP之間會(huì)有連鎖現(xiàn)象發(fā)生坠非。同樣敏沉,在測(cè)序時(shí)同樣存在連鎖不平衡現(xiàn)象,而且即使測(cè)序的費(fèi)用降到非常低的水平炎码,要想如GWAS研究一般地獲得大量樣本的基因組數(shù)據(jù)還是非常困難的盟迟。
GWAS分析新突破
捷倫科技公司和華大基因?qū)⒂?012年2月29日正式宣布,雙方將共同研究與開(kāi)發(fā)新一代的全基因組關(guān)聯(lián)研究(GWAS)方法潦闲。此次合作旨在基于安捷倫的SureSelect技術(shù)創(chuàng)建新一代“超級(jí)外顯子”捕獲芯片攒菠,這款產(chǎn)品將會(huì)包含適用于不同特定人群的更豐富的基因序列信息。 作為此次合作的一部分歉闰,華大基因已經(jīng)采用
近期辖众,來(lái)自中科院廣州生物醫(yī)藥與健康研究所的裴端卿課題組發(fā)現(xiàn)并破解了維生素C促進(jìn)體細(xì)胞“變身”為誘導(dǎo)多能干細(xì)胞(iPSC)的分子障礙。相關(guān)研究成果于11月17日在線發(fā)表在國(guó)際頂級(jí)生物學(xué)期發(fā)布和敬。