Rakyan VK, Down TA, Balding DJ, Beck S (2011) Epigenome-wide association studies for common human diseases. Nat Publ Gr 12:529–541. doi: 10.1038/nrg3000
摘要| 盡管全基因組關(guān)聯(lián)研究(GWAS)在鑒定與常見疾病相關(guān)的基因座方面的成功,但大部分的因果關(guān)系仍然不明。 基因組技術(shù)的最新進(jìn)展使我們能夠開始大規(guī)模研究人類疾病相關(guān)的表觀遺傳變異悴晰,特別是DNA甲基化的變異祷安。 這種表觀基因組范圍的關(guān)聯(lián)研究(EWAS)提供新的機(jī)會诗祸,但也產(chǎn)生在GWAS中未遇到的新挑戰(zhàn)。 我們討論EWAS設(shè)計(jì),隊(duì)列和樣本選擇工窍,統(tǒng)計(jì)顯著性和功效科乎,混雜因素和隨訪研究壁畸。
闡明人類復(fù)雜疾病(也可換成整個生物界所有有意義的性狀)的遺傳和非遺傳決定因素是生物醫(yī)學(xué)研究的主要挑戰(zhàn)之一茅茂。近年來捏萍,全基因組關(guān)聯(lián)研究(GWASs)已經(jīng)為150多種疾病和其他性狀發(fā)現(xiàn)了> 800個SNP關(guān)聯(lián)1。盡管對于任何人類復(fù)雜疾病還不知道完整的遺傳基礎(chǔ)空闲,但是對外顯子 - 并且最終完整的基因組 - 的確定有望識別大多數(shù)致病性遺傳變異令杈。然而,現(xiàn)在越來越感興趣探索非遺傳變異碴倾,包括表觀遺傳因素如何影響復(fù)雜的疾病病因2-4逗噩。
細(xì)胞的表觀基因組是高度動態(tài)的,由遺傳和環(huán)境因素的復(fù)雜相互作用控制5跌榔。正常細(xì)胞功能依賴于表觀基因組穩(wěn)態(tài)的維持异雁,這進(jìn)一步突出表現(xiàn)在表觀基因組擾動和人類疾病,特別是癌癥之間的許多報(bào)告的關(guān)聯(lián)4僧须。然而纲刀,迄今為止這種關(guān)聯(lián)的大多數(shù)研究已經(jīng)進(jìn)行或者具有不足的基因組覆蓋(例如,幾十到幾百個基因座)担平,但是足夠的樣品量示绊,或者具有更接近全基因組的覆蓋度(數(shù)千個基因座)但樣本量不足。因此暂论,對于任何人類復(fù)雜疾病耻台,我們?nèi)匀徊恢揽蓺w因于個體間表觀基因組變異的表型變異的比例。這個問題只能通過大規(guī)模空另,系統(tǒng)的表觀基因組等價(jià)的GWAS-表觀基因組范圍的關(guān)聯(lián)研究(EWASs)來闡明盆耽,如2008年首次提出的(參考文獻(xiàn)6)。至少對于DNA甲基化(DNAm)扼菠,現(xiàn)在可以獲得在分辨率和通量上與高度成功的GWAS芯片直接相當(dāng)?shù)募夹g(shù)摄杂,其允許大約500,000(500K)SNP的基因分型。
但是循榆,如何進(jìn)行EWAS析恢?除了GWAS和EWAS共有的考慮因素(例如,適當(dāng)?shù)募夹g(shù)和樣品量)秧饮,EWAS的設(shè)計(jì)在樣品選擇方面有特定的考慮映挂。 DNAm模式對組織和發(fā)育階段是特異性的泽篮,它們也隨時(shí)間而變化。此外柑船,EWAS關(guān)聯(lián)可以是所涉及的表型的因果性和相應(yīng)的 - 與GWAS的區(qū)別帽撑,提出了相當(dāng)大的挑戰(zhàn)。在這里鞍时,我們在設(shè)計(jì)和分析有效的EWAS的背景下討論這些考慮亏拉,記住EWAS可能隨著信息和經(jīng)驗(yàn)的積累而演變,就像GWAS一樣逆巍。
表觀遺傳變異和復(fù)雜疾病
表觀遺傳信息的類型及塘。哺乳動物中的表觀遺傳信息可以以多種形式傳播,包括有絲分裂穩(wěn)定的DNAm锐极,組蛋白和非編碼RNA(ncRNA)的翻譯后修飾笙僚。對于DNAm,主要形式是在胞嘧啶 - 鳥嘌呤二核苷酸(CpG)的背景下胞嘧啶的甲基化灵再。然而肋层,最近的研究結(jié)果表明CpH甲基化(其中H = C / A / T)可能比以前更常見的7.8。由十一位易位(TET)甲基胞嘧啶雙加氧酶催化檬嘀,5-羥甲基化9,10胞嘧啶(hmC)是另一種形式的DNAm槽驶。雖然細(xì)節(jié)仍不清楚责嚷,越來越多的證據(jù)表明hmC在基因調(diào)控和分化中的作用11鸳兽。組蛋白修飾包括(僅舉幾個)核心組蛋白的氨基末端尾中的一個或多個氨基酸的單 - ,二 - 或三甲基化罕拂,乙踝嵋欤化和瓜氨酸化5。最近爆班,已經(jīng)發(fā)現(xiàn)ncRNA可以自我繁殖并且獨(dú)立于下面的DNA而被傳遞;換句話說衷掷,他們可以“表觀遺傳”地傳遞監(jiān)管信息12,13。這樣的ncRNA包括短微小RNA(miRNA)柿菩,PIWI相互作用RNA(piRNA)和大型基因間非編碼RNA(lincRNA)等戚嗅。
健康和疾病的表觀遺傳變異∈嗖埃考慮到二倍體人類表觀基因組含有> 108個Cs(其中> 107個是CpG)和> 108個組蛋白尾巴懦胞,所有潛在的變化,目前未知但是潛在的表觀遺傳標(biāo)記的范圍凉泄。最經(jīng)研究的表觀遺傳標(biāo)記是DNAm躏尉,BOX 1討論DNAm變化的最常見的特征和背景。在單個CpG位點(diǎn)的DNAm變異被稱為甲基化可變位置(MVP)后众,其可以被認(rèn)為是SNP14的表觀遺傳學(xué)等價(jià)物胀糜。很少颅拦,每個等位基因的僅兩條DNA鏈之一上的CpG被甲基化。這被稱為半甲基化教藻,并且它可能反映在增殖細(xì)胞中DNAm維持中的復(fù)制后滯后距帅。如果DNAm在多個相鄰的CpG位點(diǎn)被改變,這被稱為差異甲基化區(qū)(DMR)怖竭。 DMR在長度上變化相當(dāng)大:它們通常<1kb锥债,但是它們可以超過1Mb15。
直到最近痊臭,MVP和DMR主要在核心啟動子哮肚,CpG島(CGI)和印跡差異甲基化區(qū)域(iDMR)的背景下進(jìn)行研究;然而,越來越清楚的是DNAm是高度動態(tài)的广匙,甚至在這些區(qū)域之外允趟。例如,最近的一項(xiàng)研究發(fā)現(xiàn)鸦致,組織和癌癥特異性DMRs優(yōu)先發(fā)生在鄰近CGI的區(qū)域 - 所謂的CGI海岸16潮剪。 DNAm還在沉默重復(fù)元件中具有關(guān)鍵作用,這也可能對疾病病因17,18造成影響分唾。
DNAm變異在復(fù)雜疾病中的作用主要在癌癥的背景中探討抗碰,可以被認(rèn)為是早期EWAS。這些研究的結(jié)果已被廣泛討論4,19绽乔,關(guān)鍵的一般結(jié)論是腫瘤發(fā)展與CGI的DNAm增加弧蝇,重復(fù)元件的損失印跡和表觀遺傳重塑相關(guān),特別是衛(wèi)星DNA的DNAm損失20折砸, 21看疗。對于非惡性的,常見的復(fù)雜疾病睦授,例如糖尿病或自身免疫两芳,表觀遺傳組分僅剛剛開始研究。支持表觀遺傳組分參與這些疾病的觀察包括以下去枷。首先怖辆,對于任何復(fù)雜疾病的單卵雙生子協(xié)調(diào)幾乎從未100%。近來删顶,對于系統(tǒng)性紅斑狼瘡22和自閉癥譜系障礙23不一致的單性雙胞胎的小規(guī)模EWAS已經(jīng)在單卵型對中發(fā)現(xiàn)了疾病相關(guān)的表觀遺傳學(xué)差異竖螃。其次,幾種復(fù)雜疾惨砟帧(例如1型糖尿舶弑恰)的發(fā)病率在一般人群中上升,并且在移民人口中經(jīng)常改變猎荠,這表明非遺傳因素的作用坚弱。第三蜀备,流行病學(xué)證據(jù)表明,在子宮或早期兒童環(huán)境中次優(yōu)的可能對成年期的疾病結(jié)果(例如2型糖尿不囊丁)有影響碾阁,這種現(xiàn)象稱為“發(fā)育重編程”(參考文獻(xiàn)25)。目前些楣,子宮環(huán)境的分子記憶的主要候選是表觀遺傳修飾脂凶,包括DNAm26-28。
表觀遺傳變異作為疾病的結(jié)果或原因愁茁。如上所述蚕钦,表觀遺傳變異可以是疾病的病因或可以作為疾病的結(jié)果而出現(xiàn)。作為疾病的結(jié)果鹅很,直接或間接可能出現(xiàn)表觀遺傳變異 - 其實(shí)例可包括自身免疫性疾病中免疫相關(guān)細(xì)胞的長期改變嘶居,2型糖尿病中改變的代謝調(diào)節(jié)或體細(xì)胞突變誘導(dǎo)的表觀遺傳改變癌癥。然而促煮,將其與導(dǎo)致疾病過程的表觀遺傳變異區(qū)分開并不是直截了當(dāng)?shù)模ㄎ覀儗⒃谙旅娓敿?xì)地討論)邮屁,但是永遠(yuǎn)不是至關(guān)重要的;這是因?yàn)樗鼘⒂兄陉U明疾病相關(guān)變異的功能作用及其在診斷或治療方面的潛在效用。實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵步驟是確定變異是否存在于任何明顯的疾病跡象之前菠齿。在這方面佑吝,考慮如何在疾病之前出現(xiàn)這樣的表觀遺傳變異是有用的。首先绳匀,它可以是遺傳的芋忿,因此存在于所有組織中,包括胚系(即襟士,跨代表觀遺傳)盗飒,盡管這種現(xiàn)象的程度尚不完全清楚嚷量。第二陋桂,它可以隨機(jī)出現(xiàn),如果發(fā)生在早期(例如子宮內(nèi))發(fā)展中蝶溶,則出現(xiàn)全身性[29,30]嗜历,或者可以局限于一個或幾個組織31,32,如果它發(fā)生在出生后或在成人期間抖所。第三梨州,它可能是環(huán)境誘導(dǎo),通過成人生活方式相關(guān)因素田轧,如飲食或吸煙33暴匠,甚至在子宮內(nèi);即,發(fā)育重編程(如上所述)傻粘。
還有可能的是每窖,潛在的基因型影響表觀遺傳變異帮掉,最近由幾個研究表明34-39。含有影響甲基化狀態(tài)的遺傳變異的基因座被稱為甲基化數(shù)量性狀基因座(methQTLs)34窒典。在大多數(shù)甲基喹唑啉酮中蟆炊,與順式基因型的相關(guān)性是最顯著的。有一些證據(jù)表明遺傳變異也可以影響反式的表觀遺傳狀態(tài)瀑志,但這似乎不像順式效應(yīng)那樣普遍涩搓。此外,重要的是要注意劈猪,在大多數(shù)這些以前的研究中昧甘,真正的致病性遺傳變異沒有明確地鑒定,并且大多數(shù)甲基化QTL在順式基因型和表觀基因型之間沒有表現(xiàn)出嚴(yán)格的一對一關(guān)系;相反战得,指定的基因型產(chǎn)生增加的甲基化概率疾层。 Feinberg和Irizarry2最近爭論的小鼠和人類基因組中的遺傳變異的存在,不改變平均表型贡避,而是表型的變異性;這可以通過可變甲基化區(qū)域進(jìn)行表觀遺傳學(xué)調(diào)節(jié)(VMR痛黎,參見框1)。 MetQTLs的存在為綜合GWAS和EWAS揭示通過表觀遺傳變異發(fā)揮其功能的基因型提供了強(qiáng)有力的論證(稍后討論)刮吧。
這些methQTLs也會影響等位基因特異性甲基化(ASM湖饱,參見BOX 1)。在這種情況下杀捻,穩(wěn)態(tài)甲基化水平在同一細(xì)胞內(nèi)的兩個等位基因不同舍咖。然而,ASM也可以在沒有任何特定基因型 - 表觀遺傳型相關(guān)性的情況下發(fā)生痹愚。例如顿锰,親本印記,X染色體失活和一個等位基因的隨機(jī)單等位基因甲基化都是ASM的實(shí)例垢袱,其不是由甲基化和非甲基化等位基因之間的基礎(chǔ)基因型差異引起的墓拜。
最后,還值得考慮的是请契,在一些情況下咳榜,疾病相關(guān)的表觀遺傳變異可能在疾病發(fā)作之前出現(xiàn),但可能不是疾病本身的原因爽锥。這種類型的epi現(xiàn)象可能是由于混雜涌韩,其中環(huán)境因素(如吸煙)或遺傳變異誘導(dǎo)異常的表觀遺傳狀態(tài)和疾病。
表觀遺傳變異和復(fù)雜疾病之間的這些潛在關(guān)系對EWAS的設(shè)計(jì)和分析有重要的影響氯夷。首先臣樱,它們將確定待采樣的最相關(guān)的組織和細(xì)胞類型。第二,反向因果關(guān)系和混雜是EWAS設(shè)計(jì)的特殊問題雇毫。盡管有相當(dāng)多的證據(jù)表明癌癥中的表觀遺傳干擾4和其他非惡性疾病的新證據(jù)22,23,40-42奢啥,但是這些研究都沒有能夠最終區(qū)分因果性和后果性遺傳變異:長期以來被認(rèn)識的問題43 。雖然任何EWAS與疾病的關(guān)聯(lián)都是潛在的進(jìn)步嘴拢,但是能夠識別因果關(guān)系的方向?qū)O大地幫助確定表觀遺傳變異的有用性桩盲,例如,疾病進(jìn)展的標(biāo)記席吴,通過治療逆轉(zhuǎn)的目標(biāo)與epi藥物(即赌结,對epi基因組有影響的藥物),或通過監(jiān)測藥物誘導(dǎo)表觀遺傳變化的動力學(xué)的藥物反應(yīng)的措施孝冒。
分析表觀遺傳變異
支持大規(guī)模GWAS的主要發(fā)展之一是引入強(qiáng)大但可負(fù)擔(dān)的基因分析技術(shù)柬姚,特別是SNP陣列。只有最近有表觀基因組分析技術(shù)達(dá)到大型EWAS變得可行的階段庄涡。為了使這些研究成為可能量承,標(biāo)記或分子必須是穩(wěn)定的,適合于高通量分析穴店,并且在常規(guī)臨床樣品中容易獲得撕捍。自動化全基因組譜分析方法也必須可用。目前泣洞,DNAm(特別是CpG甲基化)是EWAS最合適的標(biāo)記忧风。其他表觀遺傳標(biāo)記可能與DNAm一樣重要(或更多),但是球凰,在臨床標(biāo)本中既不容易獲得狮腿,也不適于高通量加工。此外呕诉,在不同的表觀遺傳標(biāo)記之間有許多完善的相關(guān)性缘厢,因此分析DNAm可以,雖然間接提供組蛋白修飾狀態(tài)和RNA動力學(xué)的信息5甩挫。
原則上贴硫,基于排序和基于陣列的分析技術(shù)可以用于EWAS。這兩種技術(shù)的最常見的平臺已被廣泛審查44和獨(dú)立基準(zhǔn)45,46捶闸,并在BOX 2中列出夜畴。作為這種類型的研究的典型拖刃,選擇取決于平衡覆蓋删壮,分辨率,準(zhǔn)確性兑牡,特異性央碟,吞吐量和成本47。最終,基于測序的技術(shù)可能占據(jù)主導(dǎo)地位亿虽,但我們認(rèn)為菱涤,基于陣列的方法(如用于GWAS的方法)是目前最適合EWAS的方法。如BOX 2所述洛勉,有定制和現(xiàn)成平臺的選項(xiàng)粘秆,涵蓋上述選擇。
其中收毫,最近發(fā)布的Illumina 450K Infinium Methylation BeadChip似乎是第一波EWAS最有希望的攻走,提供了全基因組覆蓋(> 450K CpG位點(diǎn)),分辨率(單堿基對)和吞吐量(每個芯片12個樣本和每次運(yùn)行多達(dá)96個樣本)此再。
研究EWAS的設(shè)計(jì)
在本節(jié)中昔搂,我們討論EWAS的最有信息的研究設(shè)計(jì),關(guān)于研究主題的類型和解決反向因果關(guān)系的問題输拇。圖1示出了所討論的四個示例的一些優(yōu)點(diǎn)和缺點(diǎn)摘符。
回顧性(病例對照)。最常用的GWAS設(shè)計(jì)涉及基于其表型招募的不相關(guān)個體(例如策吠,病例和對照)逛裤。許多病例對照樣品已經(jīng)可用,在一些情況下具有可以與表觀基因組數(shù)據(jù)整合的基因型和表達(dá)數(shù)據(jù)猴抹。然而别凹,回顧性研究不能確定確定的表觀遺傳變異是否歸因于疾病相關(guān)的遺傳差異,疾病后過程或疾病相關(guān)藥物干預(yù)洽糟。使用病例對照研究來鑒定表觀遺傳變異和臨床相關(guān)表型之間的關(guān)聯(lián)的早期實(shí)例包括關(guān)于代謝功能障礙48和用他莫西芬治療的研究49炉菲。
父子孫對。這些可用于EWAS坤溃,其目的在于鑒定表觀遺傳標(biāo)記的跨代傳播(BOX 3)拍霜。最近已經(jīng)證明,喂養(yǎng)F0代雄性小鼠高脂肪或低蛋白飲食從斷奶到交配時(shí)間薪介,結(jié)果F1代后代變化的代謝型胎兒28,50祠饺。由于精子將非常少的(如果有的話)細(xì)胞質(zhì)材料傳遞給后代,這些實(shí)施例表明由F0雄性的次優(yōu)飲食誘導(dǎo)的表觀遺傳變異體的跨代傳播汁政。使用親代 - 后代三重體的表觀基因組譜的類似策略可用于人類道偷。例如,如果有證據(jù)表明父親環(huán)境影響后代的表型結(jié)果记劈,可以在后代中進(jìn)行綜合表觀基因組和基因組譜勺鸦,以鑒定改變的表觀遺傳變異。然后遺傳信息可用于消除遺傳修飾因子引起表觀遺傳變異的可能性目木。這樣的研究設(shè)計(jì)將需要使用能夠檢測等位基因特異性差異的分析方法换途,需要足夠的功率,并需要對父母環(huán)境暴露的可靠測量。
單純雙胞胎军拟。與感興趣的疾病無關(guān)的單純雙胞胎代表了EWAS的有用資源剃执,因?yàn)槿魏我谚b定的疾病相關(guān)的表觀遺傳變異體不能由種系遺傳變異引起32,51。然而懈息,除非雙胞胎縱向招募肾档,這是很少可能的,這些研究不能用于區(qū)分原因和后果的原因前面討論的原因辫继。招募大量不一致的同卵雙胞胎為一個良好的研究是一個潛在的問題阁最,但一些大型雙資源可用(見更多信息)。
縱向隊(duì)列骇两∷僦郑縱向隊(duì)列設(shè)計(jì)在最初無疾病的人(理想地從出生)在多年的過程中,記錄疾病事件和其他表型變化和采取生物樣品低千。它們建立起來是昂貴的配阵,但是許多這樣的研究已經(jīng)在進(jìn)行,其中一些涉及用于EWAS的適當(dāng)?shù)慕M織(參見更多信息)示血。例如棋傍,英國1946年的出生隊(duì)列52提供了超過5000個人的樣本和數(shù)據(jù)(迄今為止)65年。與許多病例對照設(shè)計(jì)相比难审,這些研究的兩個主要優(yōu)點(diǎn)是避免了由于病例和對照的招募中的差異而導(dǎo)致的混雜以及由于在風(fēng)險(xiǎn)因子的測量中的病例對照差異而導(dǎo)致的偏差瘫拣。縱向研究對于建立疾病相關(guān)表觀遺傳變異的時(shí)間起源和穩(wěn)定性也是非常有價(jià)值的,從而有助于區(qū)分因果遺傳變異與后果變異告喊。如果還記錄了環(huán)境影響麸拄,可以將這些影響與表觀遺傳變化相關(guān)聯(lián)。
縱向疾病不和諧單卵雙胞胎隊(duì)列將傳達(dá)排除遺傳影響疾病相關(guān)的外來遺傳變異的額外優(yōu)勢黔姜,但這種隊(duì)列很少可用于常見疾病的EWAS拢切。以下討論折衷的兩階段研究設(shè)計(jì),其涉及用于發(fā)現(xiàn)階段的疾病不一致的單合子雙胞胎隊(duì)列和用于復(fù)制階段的不同的縱向隊(duì)列秆吵。
EWAS的組織選擇
在GWAS中淮椰,大多數(shù)組織類型適合于鑒定種系遺傳變異,通常使用從患者血液或血液細(xì)胞衍生的細(xì)胞系中提取的DNA纳寂。然而主穗,疾病相關(guān)的表觀遺傳變異可以是組織特異性的。由于大多數(shù)EWAS使用活體個體毙芜,DNA樣品只能從某些來源容易地獲取忽媒,例如血液,頰爷肝,唾液猾浦,毛囊陆错,尿和糞便灯抛。例如金赦,血液和血液亞型與自身免疫性疾病或基于血液的癌癥相關(guān),并且如果表觀遺傳變異體存在于全體范圍內(nèi)对嚼,則任何組織都將足夠(如果在早期胚胎發(fā)生中在發(fā)育重編程期間誘導(dǎo)的情況) 夹抗。然而,對于許多疾病纵竖,需要探索替代的組織來源漠烧。這些可以包括測定無細(xì)胞的血清DNA - 包括來自流入血液的增殖細(xì)胞的DNA(如對于大多數(shù)癌癥發(fā)生的)或死后DNA,但是如果目的是建立因果關(guān)系靡砌,則后者是不太合適的選擇已脓。事實(shí)上,直到表觀基因組譜可以以非侵入性方式(例如通殃,通過成像技術(shù)53)和/或使用小組織生物體54常規(guī)執(zhí)行度液,仍然是執(zhí)行有效的挑戰(zhàn)
用于腦基礎(chǔ)和某些其他疾病的EWAS。
另一個重要問題是組織異質(zhì)性画舌。所有組織由多種細(xì)胞類型組成(例如堕担,血液含有> 50種不同的細(xì)胞類型)。如果疾病相關(guān)變異局限于僅代表抽樣組織的一小部分的某種細(xì)胞類型曲聂,則可能無法檢測到變異霹购。疾病狀態(tài)本身也可以改變組織中細(xì)胞類型的組成(例如,發(fā)炎組織將具有略微不同的細(xì)胞類型與非發(fā)炎組織的組成)朋腋。因此齐疙,測量的病例和對照之間的表觀遺傳學(xué)差異可能僅反映細(xì)胞類型組成的差異,而不是真實(shí)的表觀遺傳學(xué)差異旭咽。最后剂碴,血斑(或Guthrie)卡是另一個有價(jià)值的DNA來源。這些在出生后立即在許多發(fā)達(dá)國家常規(guī)使用臍帶或腳跟血液轻专。在幾個國家已經(jīng)建立了包括DNA和可能的其他組織的生物庫忆矛,以及表型信息更多信息)。
EWAS設(shè)計(jì)示例
沒有一個適合所有目的的EWA??S設(shè)計(jì);相反请垛,最合適的設(shè)計(jì)取決于所需的結(jié)果催训。這可以從可以進(jìn)行的許多可能的EWAS設(shè)計(jì)中的兩個假設(shè)示例的形式來最好地示出。
疾病風(fēng)險(xiǎn)表觀遺傳標(biāo)記的EWAS宗收。讓我們假設(shè)我們有興趣識別在自身免疫性疾病發(fā)作之前出現(xiàn)的DNAm變體漫拭。我們可以開始通過對與疾病不一致的單卵雙胞胎進(jìn)行全基因組DNAm分析來鑒定免疫效應(yīng)細(xì)胞中疾病相關(guān)的MVP(即與疾病相關(guān)的血細(xì)胞亞群),這不是由于遺傳變異混稽。然后我們可以采取這些MVP采驻,并在來自前瞻性隊(duì)列的相同類型的免疫效應(yīng)細(xì)胞中檢測它們审胚,以在疾病發(fā)生之前和之后取樣的無關(guān)個體中的這些位點(diǎn)處觀察DNAm±衤茫可以在疾病發(fā)作之前被驗(yàn)證的任何MVP因而是候選因果變化膳叨,并且不能歸因于疾病后效應(yīng),例如長期藥物或免疫相關(guān)效應(yīng)痘系。主要的隨訪研究可以包括與基因表達(dá)和其他表觀遺傳標(biāo)記的相關(guān)性菲嘴,以調(diào)查受影響的途徑√洌總的來說龄坪,這個EWAS設(shè)計(jì)結(jié)合了來自兩個獨(dú)立隊(duì)列的疾病相關(guān)組織的分析,允許發(fā)現(xiàn)和驗(yàn)證MVP并消除各種混雜因素复唤。
藥物反應(yīng)表觀遺傳標(biāo)記的EWAS健田。幾個癌癥研究已確定可能潛在地用于監(jiān)測疾病進(jìn)展甚至對治療的反應(yīng)的表觀遺傳變異4。這些變體中的一些通過測定由原發(fā)性腫瘤脫落到患者血清中的DNA來檢測佛纫,因此提供相對直接的評估進(jìn)展的方法55妓局。 EWAS還可以在藥物治療之前,期間和之后測量患有特定形式的癌癥的單身病人的血清中的DNAm狀態(tài)雳旅。這可能潛在識別預(yù)測對實(shí)時(shí)治療的最佳反應(yīng)的表觀遺傳標(biāo)記跟磨。癌癥相關(guān)的表觀遺傳變異體(即遺傳或環(huán)境)的根本原因不需要知道,也不需要直接分析原發(fā)性腫瘤攒盈,因?yàn)樵撟儺愺w是進(jìn)展或反應(yīng)的有效量度抵拘。
EWAS的統(tǒng)計(jì)考慮
樣本量大小和功效。在2005年型豁,正如GWAS波即將破裂一樣僵蛛,Wang等人發(fā)表了一篇有影響的評論,爭論大樣本量來檢測小的影響迎变,他們強(qiáng)調(diào)了次要等位基因頻率(MAF)和效應(yīng)大小的作用在確定SNP關(guān)聯(lián)測試的能力充尉。他們還討論了群體遺傳學(xué)理論的MAF譜的預(yù)測與群體內(nèi)的SNP以及預(yù)測效應(yīng)大小分布的(限制的)理論和數(shù)據(jù)。相應(yīng)的論證對于EWAS來說并不那么引人注目衣形,但是相關(guān)的參數(shù)甚至更難以預(yù)測驼侠,因?yàn)閿?shù)據(jù)和相關(guān)理論的缺乏。 DNA等位基因通常不會跨細(xì)胞變化谆吴,并且現(xiàn)在可以以低錯誤率進(jìn)行分型倒源。相比之下,甲基化狀態(tài)可以是組織特異性的句狼,并且可以在組織內(nèi)的細(xì)胞笋熬,細(xì)胞內(nèi)的等位基因(ASM)以及在罕見的情況下在等位基因內(nèi)的DNA鏈(半甲基化)之間變化。因此腻菇,對于來自一個個體的組織樣品胳螟,在CpG位點(diǎn)測量的甲基化狀態(tài)在0和1之間昔馋,因?yàn)樗羌?xì)胞,等位基因和鏈的平均值糖耸,并且由測量誤差進(jìn)一步模糊秘遏。在這里,我們使用關(guān)于DNAm變體的頻譜的有限的可用信息蔬捷,以及它們對常見疾病的效應(yīng)大小垄提,暫時(shí)提出在三種情況下的功率計(jì)算榔袋。目前尚不清楚擬議的情景是多么現(xiàn)實(shí)周拐,但我們希望至少能夠刺激對EWAS設(shè)計(jì)的這一重要方面的進(jìn)一步討論和調(diào)查。
最近的甲基化分析報(bào)道凰兑,平均68%的CpG位點(diǎn)在人外周血單核細(xì)胞中甲基化57妥粟。在基因組上下文中存在巨大差異:高CpG密度區(qū)域中的CpG位點(diǎn)幾乎總是未甲基化的,CGI和5'-UTR也是如此吏够。相比之下勾给,3'-UTR,內(nèi)含子和重復(fù)元件主要是甲基化的锅知。 ASM的速率估計(jì)在0.3%和0.6%之間(大于單獨(dú)印記的比率)播急。發(fā)現(xiàn)半甲基化是罕見的(<0.2%,其包括非CpG甲基化和不完全的bisulphite轉(zhuǎn)化)售睹。甲基化譜不對稱:幾乎沒有接近100%甲基化的位點(diǎn)桩警,但幾乎完全未甲基化的位點(diǎn)并不罕見。
在圖1在圖2a昌妹,b中捶枢,三種不同類別的個體('甲基化','中間'和'非甲基化')的假設(shè)甲基化譜已經(jīng)組合以在病例和對照中產(chǎn)生總頻率譜飞崖。這些形成了表1中報(bào)道的功效模擬的基礎(chǔ)烂叔。病例和對照之間的平均甲基化率的差異提供了效應(yīng)大小的流行概述,但它不反映甲基化譜的差異或其他特征的差異固歪。它也不反映甲基化率的相對量級蒜鸡,而如果對照中罕見的表觀基因型在病例中幾乎不存在,則這可能比更常見的表觀基因型的平均率的相同差異更重要牢裳。
賠率比率是二元表型的遺傳效應(yīng)大小的公認(rèn)的度量逢防。如果我們認(rèn)為病例(或?qū)φ眨┲心硞€位點(diǎn)的平均甲基化率代表在病例(或?qū)φ眨┙M織樣本中隨機(jī)選擇的DNA鏈的甲基化概率,則我們可以計(jì)算甲基化優(yōu)勢比(methor) 贰健。該methOR與普通優(yōu)勢比相同胞四,除了采樣單元是DNA鏈而不是個體。因此伶椿,methOR是來自待甲基化的隨機(jī)病例的組織樣品中的隨機(jī)DNA鏈的可能性辜伟,除以對照的相同幾率氓侧。這提供了結(jié)合相對幅度的效應(yīng)大小的測量,但是导狡,與速率的平均差異一樣约巷,它也不允許甲基化譜的特征(例如其方差)的情況和對照之間的差異。至于其他比值比旱捧,methOR在前瞻性和回顧性研究中是可比的独郎,其價(jià)值僅衡量關(guān)聯(lián),并不暗示因果關(guān)系枚赡。
表1給出了來自圖1的三組甲基化譜的基于模擬的功率估計(jì)氓癌。 2.他們有類似的甲基化,雖然病例對照差異的平均甲基化率是相同的a和b贫橙,但不是c贪婉。 a和b之間的功率值不同的事實(shí)強(qiáng)調(diào)了沒有效應(yīng)大小的單數(shù)量度,因?yàn)楣β嗜Q于病例和對照中的整個甲基化譜卢肃。然而疲迂,對于在我們的模擬中進(jìn)行的邏輯回歸分析,methOR給出了比速率差異更好的功率指導(dǎo)莫湘。當(dāng)methOR為1.25左右時(shí)尤蒿,800個病例+ 800個對照的樣本量足以在情景c而不是a或b時(shí)在α= 10-6的顯著性水平下實(shí)現(xiàn)80%的功率(參見下一節(jié)討論基因組EWAS的廣泛意義)。當(dāng)methOR為約1.5時(shí)幅垮,400 + 400的樣本大小對于b和c而不是α在α= 10-6處給出80%的功率腰池。
目前對于涉及疾病的表觀遺傳變異體的甲基化譜的實(shí)際差異知之甚少,并且關(guān)于樣本大小的建議將需要與新出現(xiàn)的數(shù)據(jù)一起演變军洼。最近關(guān)于吸煙對甲基化的影響的報(bào)告58鑒定了位于凝血因子II(凝血酶)受體樣3(F2RL3)中的CpG位點(diǎn)處的一個強(qiáng)締合巩螃,其中中值甲基化率為95%,從未吸煙匕争, 83%為重度吸煙者避乏,給出12%的差異和methOR = 2.7。甲基化狀態(tài)在從未吸煙的人中比在重吸煙者(四分位數(shù)范圍分別為0.94-0.96和0.78-0.88)不太可變甘桑。對于這樣強(qiáng)烈的影響拍皮,65名重度吸煙者和56名非吸煙者的樣本量足以檢測這種關(guān)聯(lián)。然而跑杭,已知吸煙是健康的最重要的環(huán)境因素之一铆帽,因此感興趣的其他效應(yīng)大小可能小得多。如果我們將1.5作為目標(biāo)methOR值德谅,那么追求具有少于400個案例和400個控制的EWAS似乎不具有成本效益爹橱,其中800個將優(yōu)選實(shí)現(xiàn)良好的權(quán)力。這遠(yuǎn)遠(yuǎn)小于2000案例和控制窄做,這成為威康信托案例控制聯(lián)盟(WTCCC)研究59后GWAS的事實(shí)上的標(biāo)準(zhǔn)最低樣本量愧驱,反映了EWAS和GWAS的效應(yīng)大小不能直接比較的事實(shí)慰技。似乎可能的是,效應(yīng)大小和因此功率將根據(jù)基因組背景顯著變化组砚,在這種情況下吻商,P值的全基因組排序不令人滿意60和考慮功率的貝葉斯支持措施更合適。然而糟红,目前仍有一些信息用于通知貝葉斯效應(yīng)大小的先前分布艾帐。