歡迎關(guān)注公眾號:oddxix
本次主要介紹一下DNA的甲基化和羥甲基化的高通量測序揍异。DNA的甲基化是在DNA的序列不變的條件下安岂,在其中某些堿基上加上甲基的這樣一個過程渐扮。
DNA甲基化的結(jié)果,一般是使甲基化位點的下游的基因表達量變少筷笨。
DNA甲基化
化學(xué)反應(yīng)
這個(甲基化)分析方法當中的核心化學(xué)反應(yīng)仍翰,是用亞硫酸氫鹽來處理DNA赫粥。DNA當中,沒有甲基化或羥甲基化的C堿基予借,就會被轉(zhuǎn)化成U堿基越平。我們來看這個轉(zhuǎn)化的過程频蛔,在弱酸性條件下,亞硫酸氫根會結(jié)合到?jīng)]有甲基化的C堿基的6位秦叛。而甲基化了的C堿基不會和亞硫酸氫根發(fā)生這個反應(yīng)的晦溪。
然后,用堿來處理挣跋。結(jié)合了亞硫酸氫根的非甲基化的C三圆,就被脫氨基,并且脫亞硫酸根避咆。然后舟肉,就被轉(zhuǎn)化成U堿基。
那么查库,甲基化或者羥甲基化的C堿基路媚,因為之前沒有和亞硫酸氫根起反應(yīng),所以現(xiàn)在用堿來處理樊销,它也不會發(fā)生脫氨基反應(yīng)整慎。所以,它還保持了是“C”现柠。用亞硫酸氫鹽來處理DNA院领,可以讓99%左右的非甲基化的C堿基變成U。也就是說這種方法的的轉(zhuǎn)化效率非常高够吩,轉(zhuǎn)化效率達到了99%。
它的優(yōu)點丈氓,就可以讓我們接下來通過高通量測序的方法周循,可以精確地看到單個堿基的甲基化的水平。經(jīng)過亞硫酸氫鹽轉(zhuǎn)化過的DNA万俗,再經(jīng)過PCR湾笛,PCR新合成出來的鏈,U堿基的位置闰歪,就會被替換成了“T”嚎研。那么在接下來的測序過程中,測到的也是T堿基库倘。而甲基化的C临扮,因為沒有被亞硫酸氫鹽所轉(zhuǎn)化,所以教翩,在接下來的測序過程中杆勇,被測到的,還是“C”堿基饱亿。這樣蚜退,通過測序闰靴,看一個位置是“C”,還是“T”钻注。如果它保持是“C”蚂且,就說明這個位置是被甲基化、或者羥甲基化了幅恋。如果測到的是“T”杏死,就說明這個位置是沒有被甲基化、或者羥甲基化佳遣。
建庫方法
甲基化的建庫過程识埋。
- 第一種,用Illumina公司的Truseq DNA建庫方法零渐,來做甲基化測序窒舟。
因為Illumina Truseq DNA建庫試劑盒當中,它所提供的接頭诵盼,那么這個接頭上的C堿基都是已經(jīng)經(jīng)過甲基化修飾了惠豺。所以,用這些接頭做出來的文庫风宁,在用亞硫酸氫鹽做轉(zhuǎn)化的過程當中洁墙,它的(接頭上的)C還是保持是C ,不會被轉(zhuǎn)成U戒财。帶了這些接頭的文庫分子热监,就可以和測序芯片上的草皮DNA發(fā)生互補雜交。并且進一步發(fā)生橋式PCR反應(yīng)饮寞。生成測序用的DNA的簇(Cluster)孝扛。但是,這個方法有一個缺點幽崩,就是在用亞硫酸氫鹽處理DNA文庫的時侯苦始,90%以上的DNA鏈會斷掉。這樣慌申,已經(jīng)建好的文庫陌选,其中90%分子會被破壞掉。也就是說文庫的豐富度就會損失90%以上蹄溉。那么咨油,相應(yīng)的它有它的好處,它的好處就是类缤,在這個建庫過程當中用的PCR循環(huán)數(shù)較少臼勉。所以它PCR擴增效率不同,所引起的文庫不均一程度也就較低餐弱。也就是我們通常所說的PCR bias較少宴霸。
- 第二種建庫方法囱晴。為了解決文庫豐富度受到損失的這個問題,EpiCentre公司開發(fā)了EpiGnome方法瓢谢,方法的操作過程如圖畸写。
第1步,亞硫酸氫鹽先處理DNA氓扛,把未甲基化的C都轉(zhuǎn)變成U枯芬。
第2步,把帶標簽1的隨機引物加入采郎,進行第一次的復(fù)制千所。得到第1條的復(fù)制鏈。
第3步蒜埋,是消化掉過量的引物淫痰。
第4步,是加入帶末端終止堿基整份、并帶標簽2的隨機引物待错。這個引物的作用是讓第1復(fù)制鏈延伸,并且加上標簽2烈评。
第5步是加入建庫的PCR引物火俄,進行PCR。通過PCR讲冠,把Index序列和成簇引物序列加入到鏈的兩側(cè)瓜客。得到真正的文庫。
這個方法的優(yōu)點是竿开,把亞硫酸氫鹽處理的過程忆家,放在了建庫之前。這樣建成的庫的豐富程度會比較高德迹。但是這個方法也有缺點,缺點就是要做較多的PCR循環(huán)揭芍,那么有了比較多的PCR循環(huán)之后胳搞,PCR產(chǎn)物的擴增均一性是不太好的。也就是說PCR bias會比較大称杨。
上述兩種方法肌毅,各有優(yōu)缺點。
HiSeq2000/2500****測甲基化文庫的問題姑原、和解決方案
在Illumina的HiSeq 2000或者2500平臺上進行測序悬而,如果文庫是堿基平衡的文庫,也就是說锭汛,每個特環(huán)當中笨奠,A/C/G/T四種堿基的比例袭蝗,各占25%左右的話,測序儀對堿基的判讀會比較好般婆。但是如果缺少了一種或者幾種堿基到腥,測序儀對堿基的判讀就會出問題。測序得到的數(shù)據(jù)質(zhì)量就會下降蔚袍。并且效的數(shù)據(jù)產(chǎn)量也會降低乡范。因為甲基化文庫中經(jīng)過亞硫酸氫鹽處理,絕大多數(shù)的C都變成了T啤咽。所以晋辆,這個文庫中是嚴重地缺少C堿基的,也就是四種堿基的比例是嚴重不平衡的宇整。這樣在用HiSeq 2000或2500測序儀來測甲基化文庫的過程當中瓶佳,文庫測序得到的數(shù)據(jù)質(zhì)理就較差。并且經(jīng)過PF過濾得到的有效的數(shù)據(jù)產(chǎn)量也會較低没陡。
為了彌補甲基化文庫的堿基不平衡性涩哟,一般情況下,在上機過程當中盼玄,是摻入大比例的基因組文庫贴彼,或者PhiX文庫,來補充比較多的C堿基埃儿,一般會摻30%的PhiX文庫器仗、或者基因組文庫。
在摻入30%的PhiX文庫的條件下童番,一條HiSeq 2000 V3 PE100的Lane精钮,大概可以得到20G 左右的甲基化文庫數(shù)據(jù)。也就是說剃斧,在HiSeq 2000或者2500平臺上轨香,甲基化文庫的測序數(shù)據(jù)產(chǎn)量,一直都不是很高幼东。質(zhì)量也比較低臂容。
羥甲基化測序
接下來,我們說一下區(qū)分“羥”甲基化和甲基化的測序方法根蟹。
在用單純的亞硫酸氫鹽法來測的過程當中脓杉,甲基化和差甲化的C堿基都不能被轉(zhuǎn)化成U堿基,所以單純的亞硫酸氫鹽法是無法區(qū)分甲基化或羥甲基化的C堿基的简逮。
為了區(qū)分甲基化和羥甲基化球散,科學(xué)家想出了兩種辦法。
- 第一種辦法散庶,是通過高釕酸鉀(KRuO4)來氧化羥甲基化的C蕉堰。羥甲基化的C可以被轉(zhuǎn)化成甲趿杈唬化的C堿基,而甲踵业疲化的C堿基泻蚊,是可以被亞硫酸氫鹽轉(zhuǎn)化成U的。
而甲基化的C丑婿,不會被轉(zhuǎn)化成U性雄。這樣就把原來的羥甲基化的C和甲基化的C給區(qū)分開來了。
經(jīng)研究表明羹奉,用高釕酸鉀氧化的方法來氧化羥甲基化的C秒旋,其轉(zhuǎn)化效率是94%左右。也就是說诀拭,每100個羥甲基化的C中迁筛,有94個會被高釕酸鉀轉(zhuǎn)化成甲酰化的C耕挨。并進一步被亞硫酸氫鹽轉(zhuǎn)化成U细卧。同時,原來的甲基貨攤C筒占,只有2.1%會被轉(zhuǎn)化成甲跆懊恚化的C。
- 第二鐘區(qū)分羥甲基化C的方法翰苫,是用糖基把羥甲基化的C給保護起來止邮。然后用TET蛋白(Ten-eleven translocation methylcytosine dioxygenase 1),把甲基化的C轉(zhuǎn)化成羥基化的C奏窑。
進一步將羥甲基化的C轉(zhuǎn)化成甲醯寂化的C和羧基化的C。甲醢Nǎ化的C和羧基化的C都可以被亞硫酸氫鹽轉(zhuǎn)化成U撩匕。而之前被糖基化保護起來的羥甲基化的C,是不會被TET蛋白轉(zhuǎn)化成甲跄眩化的C或者羧基化的C的滑沧。在亞硫酸氫鹽的處理過程中,它還保持是C巍实。并且在之后的PCR擴增產(chǎn)物中,也表現(xiàn)為C哩牍。這樣棚潦,就可以把羥甲基化的C,和甲基化的C膝昆,給區(qū)分開來丸边。
用這個方法叠必,沒有甲基化的C,99.6%都被轉(zhuǎn)化成了U妹窖。甲基化的C纬朝,97.7%都被轉(zhuǎn)化成了U。而羥甲基化的C骄呼,只有8%被化成了U共苛。也就是說92%的羥甲基化的C得到了糖基的保護,還保持了C蜓萄。上述隅茎,就是目前2個區(qū)分羥甲基化的C和甲基化C的方法。
設(shè)置內(nèi)參
在甲基化文庫建程當中嫉沽,亞硫酸氫鹽對未甲基化的C的轉(zhuǎn)化效率并不是100%辟犀,一般是在99%左右。為了對實驗的轉(zhuǎn)化效率進行質(zhì)量控制绸硕。一般會在轉(zhuǎn)化實驗當中加入內(nèi)參對照品堂竟。一般情況下,是用甲基化酶缺陷型的大腸桿菌玻佩,所生產(chǎn)出來的完全沒有被甲基化的λ(噬菌體)DNA出嘹,或者pUC19(質(zhì)粒)DNA做內(nèi)參。來看一次實驗當中C的轉(zhuǎn)化效率夺蛇。一般情況下疚漆,實驗當中是加入1%的完全沒有甲基化的λ DNA做內(nèi)參。
同樣道理刁赦,也可以通過用甲基化酶處理過的娶聘,CpG島完全被甲基化的DNA,來跟蹤甲基化DNA對亞硫酸氫鹽轉(zhuǎn)化的抵抗效果甚脉。
數(shù)據(jù)分析
最后丸升,我們來談一下,甲基化測序后的數(shù)據(jù)處理牺氨。
因為亞硫酸氫鹽處理過后狡耻,絕大部分的C都被轉(zhuǎn)化成了T。這樣猴凹,測出來的序列在和基因組進行對比的時侯夷狰,直接對比是對比不上的。為了要進行比對郊霎,就要把基因組的堿基做兩種轉(zhuǎn)變沼头。
- 第一種轉(zhuǎn)變是把基因組上所有的C都改到T,再來和測序測到的序列來對比。這樣进倍,就可以把原來的鏈給對比上土至。
- 第二種轉(zhuǎn)變,是把基因組上所有的G都變成A猾昆,這樣才能和經(jīng)過PCR得到的原樣本鏈睥互補鏈對比得上陶因。這樣做的原因,是原樣本鏈的互被鏈垂蜗,它上面絕大部分的G楷扬,都被變成了A。所以么抗,只有把(參考)基因組上的G毅否,也都改成A,這樣才能對比得上蝇刀。比對上之后螟加,再來看哪些堿基是沒有被轉(zhuǎn)化的。這樣吞琐,就可以確認這些堿基的甲基化修飾情況了捆探。