從1977年第一代DNA測序技術(Sanger法)1蚓土,發(fā)展至今三十多年時間厦取,測序技術已取得了相當大的發(fā)展赏酥,從第一代到第三代乃至第四代喳整,測序讀長從長到短,再從短到長裸扶。
第一代測序技術
第一代DNA測序技術用的是1975年由桑格(Sanger)和考爾森(Coulson)開創(chuàng)的鏈終止法或者是1976-1977年由馬克西姆(Maxam)和吉爾伯特(Gilbert)發(fā)明的化學法(鏈降解). 并在1977年框都,桑格測定了第一個基因組序列,是噬菌體X174的,全長5375個堿基1魏保。自此熬尺,人類獲得了窺探生命遺傳差異本質(zhì)的能力,并以此為開端步入基因組學時代谓罗。研究人員在Sanger法的多年實踐之中不斷對其進行改進粱哼。在2001年,完成的首個人類基因組圖譜就是以改進了的Sanger法為其測序基礎檩咱,Sanger法核心原理是:由于ddNTP的2’和3’都不含羥基揭措,其在DNA的合成過程中不能形成磷酸二酯鍵,因此可以用來中斷DNA合成反應刻蚯,在4個DNA合成反應體系中分別加入一定比例帶有放射性同位素標記的ddNTP(分為:ddATP,ddCTP,ddGTP和ddTTP)绊含,通過凝膠電泳和放射自顯影后可以根據(jù)電泳帶的位置確定待測分子的DNA序列
第二代測序技術
總的說來,第一代測序技術的主要特點是測序讀長可達1000bp炊汹,準確性高達99.999%躬充,但其測序成本高,通量低等方面的缺點讨便,嚴重影響了其真正大規(guī)模的應用充甚。因而第一代測序技術并不是最理想的測序方法。經(jīng)過不斷的技術開發(fā)和改進霸褒,以Roche公司的454技術伴找、illumina公司的Solexa,Hiseq技術和ABI公司的Solid技術為標記的第二代測序技術誕生了傲霸。第二代測序技術大大降低了測序成本的同時疆瑰,還大幅提高了測序速度眉反,并且保持了高準確性昙啄,以前完成一個人類基因組的測序需要3年時間,而使用二代測序技術則僅僅需要1周寸五,但在序列讀長方面比起第一代測序技術則要短很多梳凛。
Illumine
Illumina公司的Solexa和Hiseq應該說是目前全球使用量最大的第二代測序機器,這兩個系列的技術核心原理是相同的2,4梳杏。這兩個系列的機器采用的都是邊合成邊測序的方法韧拒,它的測序過程主要分為以下4步,
########(1)DNA待測文庫構建
利用超聲波把待測的DNA樣本打斷成小片段十性,目前除了組裝之外和一些其他的特殊要求之外叛溢,主要是打斷成200-500bp長的序列片段,并在這些小片段的兩端添加上不同的接頭劲适,構建出單鏈DNA文庫楷掉。
########(2)Flowcell
Flowcell是用于吸附流動DNA片段的槽道,當文庫建好后霞势,這些文庫中的DNA在通過flowcell的時候會隨機附著在flowcell表面的channel上烹植。每個Flowcell有8個channel斑鸦,每個channel的表面都附有很多接頭,這些接頭能和建庫過程中加在DNA片段兩端的接頭相互配對(這就是為什么flowcell能吸附建庫后的DNA的原因)草雕,并能支持DNA在其表面進行橋式PCR的擴增巷屿。
########(3)橋式PCR擴增與變性
橋式PCR以Flowcell表面所固定的接頭為模板,進行橋形擴增墩虹,如圖4.a所示嘱巾。經(jīng)過不斷的擴增和變性循環(huán),最終每個DNA片段都將在各自的位置上集中成束诫钓,每一個束都含有單個DNA模板的很多分拷貝浓冒,進行這一過程的目的在于實現(xiàn)將堿基的信號強度放大,以達到測序所需的信號要求尖坤。
########(4)測序
測序方法采用邊合成邊測序的方法稳懒。向反應體系中同時添加DNA聚合酶、接頭引物和帶有堿基特異熒光標記的4中dNTP(如同Sanger測序法)慢味。這些dNTP的3’-OH被化學方法所保護场梆,因而每次只能添加一個dNTP。在dNTP被添加到合成鏈上后纯路,所有未使用的游離dNTP和DNA聚合酶會被洗脫掉或油。接著,再加入激發(fā)熒光所需的緩沖液驰唬,用激光激發(fā)熒光信號顶岸,并有光學設備完成熒光信號的記錄,最后利用計算機分析將光學信號轉(zhuǎn)化為測序堿基叫编。這樣熒光信號記錄完成后辖佣,再加入化學試劑淬滅熒光信號并去除dNTP 3’-OH保護基團,以便能進行下一輪的測序反應搓逾。Illumina的這種測序技術每次只添加一個dNTP的特點能夠很好的地解決同聚物長度的準確測量問題卷谈,它的主要測序錯誤來源是堿基的替換,目前它的測序錯誤率在1%-1.5%之間霞篡,測序周期以人類基因組重測序為例世蔗,30x測序深度大約為1周。
2.Roche 454
Roche 454測序系統(tǒng)是第一個商業(yè)化運營二代測序技術的平臺朗兵。它的主要測序原理是(圖5 abc)2:
(1)DNA文庫制備
454測序系統(tǒng)的文件構建方式和illumina的不同污淋,它是利用噴霧法將待測DNA打斷成300-800bp長的小片段,并在片段兩端加上不同的接頭余掖,或?qū)⒋郎yDNA變性后用雜交引物進行PCR擴增寸爆,連接載體,構建單鏈DNA文庫(圖5a)。
(2)Emulsion PCR (乳液PCR而昨,其實是一個注水到油的獨特過程)
454當然DNA擴增過程也和illumina的截然不同救氯,它將這些單鏈DNA結合在水油包被的直徑約28um的磁珠上,并在其上面孵育歌憨、退火着憨。
乳液PCR最大的特點是可以形成數(shù)目龐大的獨立反應空間以進行DNA擴增。其關鍵技術是“注水到油”(水包油)务嫡,基本過程是在PCR反應前甲抖,將包含PCR所有反應成分的水溶液注入到高速旋轉(zhuǎn)的礦物油表面,水溶液瞬間形成無數(shù)個被礦物油包裹的小水滴心铃。這些小水滴就構成了獨立的PCR反應空間准谚。理想狀態(tài)下,每個小水滴只含一個DNA模板和一個磁珠去扣。
這些被小水滴包被的磁珠表面含有與接頭互補的DNA序列柱衔,因此這些單鏈DNA序列能夠特異地結合在磁珠上。同時孵育體系中含有PCR反應試劑愉棱,所以保證了每個與磁珠結合的小片段都能獨立進行PCR擴增唆铐,并且擴增產(chǎn)物仍可以結合到磁珠上。當反應完成后奔滑,可以破壞孵育體系并將帶有DNA的磁珠富集下來艾岂。進過擴增,每個小片段都將被擴增約100萬倍朋其,從而達到下一步測序所要求的DNA量王浴。
(3)焦磷酸測序
測序前需要先用一種聚合酶和單鏈結合蛋白處理帶有DNA的磁珠,接著將磁珠放在一種PTP平板上梅猿。這種平板上特制有許多直徑約為44um的小孔氓辣,每個小孔僅能容納一個磁珠,通過這種方法來固定每個磁珠的位置粒没,以便檢測接下來的測序反應過程筛婉。
測序方法采用焦磷酸測序法簇爆,將一種比PTP板上小孔直徑更小的磁珠放入小孔中癞松,啟動測序反應。測序反應以磁珠上大量擴增出的單鏈DNA為模板入蛆,每次反應加入一種dNTP進行合成反應响蓉。如果dNTP能與待測序列配對,則會在合成后釋放焦磷酸基團哨毁。釋放的焦磷酸基團會與反應體系中的ATP硫酸化學酶反應生成ATP枫甲。生成的ATP和熒光素酶共同氧化使測序反應中的熒光素分子并發(fā)出熒光,同時由PTP板另一側(cè)的CCD照相機記錄,最后通過計算機進行光信號處理而獲得最終的測序結果想幻。由于每一種dNTP在反應中產(chǎn)生的熒光顏色不同粱栖,因此可以根據(jù)熒光的顏色來判斷被測分子的序列。反應結束后脏毯,游離的dNTP會在雙磷酸酶的作用下降解ATP闹究,從而導致熒光淬滅,以便使測序反應進入下一個循環(huán)食店。由于454測序技術中渣淤,每個測序反應都在PTP板上獨立的小孔中進行,因而能大大降低相互間的干擾和測序偏差吉嫩。454技術最大的優(yōu)勢在于其能獲得較長的測序讀長价认,當前454技術的平均讀長可達400bp,并且454技術和illumina的Solexa和Hiseq技術不同自娩,它最主要的一個缺點是無法準確測量同聚物的長度用踩,如當序列中存在類似于PolyA的情況時,測序反應會一次加入多個T忙迁,而所加入的T的個數(shù)只能通過熒光強度推測獲得捶箱,這就有可能導致結果不準確。也正是由于這一原因动漾,454技術會在測序過程中引入插入和缺失的測序錯誤丁屎。
3.Solid技術
Solid測序技術是ABI公司于2007年開始投入用于商業(yè)測序應用的儀器。它基于連接酶法旱眯,即利用DNA連接酶在連接過程之中測序晨川。它的原理是:
(1)DNA文庫構建
片段打斷并在片段兩端加上測序接頭,連接載體删豺,構建單鏈DNA文庫共虑。
(2)Emulsion PCR
Solid的PCR過程也和454的方法類似,同樣采用小水滴emulsion PCR呀页,但這些微珠比起454系統(tǒng)來說則要小得多妈拌,只有1um。在擴增的同時對擴增產(chǎn)物的3’端進行修飾蓬蝶,這是為下一步的測序過程作的準備尘分。3’修飾的微珠會被沉積在一塊玻片上。在微珠上樣的過程中丸氛,沉積小室將每張玻片分成1個培愁、4個或8個測序區(qū)域。Solid系統(tǒng)最大的優(yōu)點就是每張玻片能容納比454更高密度的微珠缓窜,在同一系統(tǒng)中輕松實現(xiàn)更高的通量定续。
#######(3)連接酶測序
這一步是Solid測序的獨特之處谍咆。它并沒有采用以前測序時所常用的DNA聚合酶,而是采用了連接酶私股。Solid連接反應的底物是8堿基單鏈熒光探針混合物摹察,這里將其簡單表示為:3’-XXnnnzzz-5’。連接反應中倡鲸,這些探針按照堿基互補規(guī)則與單鏈DNA模板鏈配對港粱。探針的5’末端分別標記了CY5、Texas Red旦签、CY3查坪、6-FAM這4種顏色的熒光染料。這個8堿基單鏈熒光探針中宁炫,第1和第2位堿基(XX)上的堿基是確定的偿曙,并根據(jù)種類的不同在6-8位(zzz)上加上了不同的熒光標記。這是Solid的獨特測序法羔巢,兩個堿基確定一個熒光信號望忆,相當于一次能決定兩個堿基。這種測序方法也稱之為兩堿基測序法竿秆。當熒光探針能夠與DNA模板鏈配對而連接上時启摄,就會發(fā)出代表第1,2位堿基的熒光信號幽钢,圖6-a和圖6-b中的比色版所表示的是第1歉备,2位堿基的不同組合與熒光顏色的關系。在記錄下熒光信號后匪燕,通過化學方法在第5和第6位堿基之間進行切割蕾羊,這樣就能移除熒光信號,以便進行下一個位置的測序帽驯。不過值得注意的是龟再,通過這種測序方法,每次測序的位置都相差5位尼变。即第一次是第1利凑、2位,第二次是第6嫌术、7位……在測到末尾后哀澈,要將新合成的鏈變性,洗脫蛉威。接著用引物n-1進行第二輪測序日丹。引物n-1與引物n的區(qū)別是,二者在與接頭配對的位置上相差一個堿基蚯嫌。也即是哲虾,通過引物n-1在引物n的基礎上將測序位置往3’端移動一個堿基位置,因而就能測定第0择示、1位和第5束凑、6位……第二輪測序完成,依此類推栅盲,直至第五輪測序汪诉,最終可以完成所有位置的堿基測序,并且每個位置的堿基均被檢測了兩次谈秫。該技術的讀長在2×50bp扒寄,后續(xù)序列拼接同樣比較復雜。由于雙次檢測拟烫,這一技術的原始測序準確性高達99.94%该编,而15x覆蓋率時的準確性更是達到了99.999%,應該說是目前第二代測序技術中準確性最高的了硕淑。但在熒光解碼階段课竣,鑒于其是雙堿基確定一個熒光信號,因而一旦發(fā)生錯誤就容易產(chǎn)生連鎖的解碼錯誤置媳。
第三代測序技術
測序技術在近兩三年中又有新的里程碑于樟。以PacBio公司的SMRT和Oxford Nanopore Technologies納米孔單分子測序技術,被稱之為第三代測序技術拇囊。與前兩代相比迂曲,他們最大的特點就是單分子測序,測序過程無需進行PCR擴增寥袭。
基本原理是: DNA聚合酶和模板結合,4色熒光標記 4 種堿基(即是dNTP),在堿基配對階段,不同堿基的加入,會發(fā)出不同光,根據(jù)光的波長與峰值可判斷進入的堿基類型奢米。同時這個 DNA 聚合酶是實現(xiàn)超長讀長的關鍵之一,讀長主要跟酶的活性保持有關,它主要受激光對其造成的損傷所影響。PacBio SMRT技術的一個關鍵是怎樣將反應信號與周圍游離堿基的強大熒光背景區(qū)別出來纠永。他們利用的是ZMW(零模波導孔)原理:如同微波爐壁上可看到的很多密集小孔鬓长。小孔直徑有考究,如果直徑大于微波波長,能量就會在衍射效應的作用下穿透面板而泄露出來,從而與周圍小孔相互干擾尝江。如果孔徑小于波長,能量不會輻射到周圍涉波,而是保持直線狀態(tài)(光衍射的原理),從而可起保護作用。同理,在一個反應管(SMRTCell:單分子實時反應孔)中有許多這樣的圓形納米小孔, 即 ZMW(零模波導孔),外徑 100多納米,比檢測激光波長小(數(shù)百納米),激光從底部打上去后不能穿透小孔進入上方溶液區(qū),能量被限制在一個小范圍(體積20X 10-21 L)里,正好足夠覆蓋需要檢測的部分,使得信號僅來自這個小反應區(qū)域,孔外過多游離核苷酸單體依然留在黑暗中,從而實現(xiàn)將背景降到最低炭序。另外啤覆,可以通過檢測相鄰兩個堿基之間的測序時間,來檢測一些堿基修飾情況惭聂,既如果堿基存在修飾窗声,則通過聚合酶時的速度會減慢,相鄰兩峰之間的距離增大辜纲,可以通過這個來之間檢測甲基化等信息笨觅。SMRT技術的測序速度很快拦耐,每秒約10個dNTP。但是见剩,同時其測序錯誤率比較高(這幾乎是目前單分子測序技術的通采迸础),達到15%,但好在它的出錯是隨機的苍苞,并不會像第二代測序技術那樣存在測序錯誤的偏向固翰,因而可以通過多次測序來進行有效的糾錯。