1. 一代測序(Sanger sequencing)
雙脫氧鏈終止法采用DNA復制原理耻台。 Sanger測序反應(yīng)體系中包括目標DNA片段盆耽、脫氧三磷酸核苷酸(dNTP)征字、雙脫氧三磷酸核苷酸(ddNTP)匙姜、測序引物及DNA聚合酶等。 測序反應(yīng)的核心就是其使用的ddNTP:由于缺少3'-OH基團框杜,不具有與另一個dNTP連接形成磷酸二酯鍵的能力咪辱,這些ddNTP可用來中止DNA鏈的延伸油狂。此外专筷,這些ddNTP上連接有放射性同位素或熒光標記基團磷蛹,因此可以被自動化的儀器或凝膠成像系統(tǒng)所檢測到味咳。
設(shè)置四個反應(yīng)體系1-4槽驶,分別加入引物掂铐、DNA聚合酶堡纬、四種dNTP蒿秦、一定比例的ddNTP(帶有放射性標記)例如1中是ddATP棍鳖,它就負責測定T堿基的位置镀裤;依次2是ddCTP禽绪,3是ddTTP旧困, 4是ddGTP吼具。假如擴增過程中ddATP遇到了T位點拗盒,就結(jié)合并終止(因為ddNTP的2‘和3'都沒有羥基),一段時間內(nèi)大量的ddNTP會結(jié)合完所有測序位點陡蝇。
最后利用凝膠電泳和放射自顯影只能看到帶有熒光標記的ddNTP登夫,他們的排列順序先利用電泳條帶前后關(guān)系確定下悼嫉,再用A-T, T-A, C-G, G-C關(guān)系反轉(zhuǎn)一下,就能知道我們的測序序列蹋凝。
一代測序技術(shù)的主要特點就是測序讀長可達1000bp鳍寂,準確性高達99.999%迄汛,二三代所不能及)鞍爱,但它的通量低睹逃,成本高。目前一代測序在驗證序列(就是平時送公司測序返回來自己blast的那些)以及驗證基因組組裝完整性方面都是金標準佑笋。
2. 二代測序(sequencing by synthesis,SBS)
Roche公司的454技術(shù)蒋纬、illumina公司的Solexa/Hiseq技術(shù)和ABI公司的SOLID技術(shù)標志第二代測序技術(shù)誕生颠锉。其中Roche公司的454測序系統(tǒng)是第二代測序技術(shù)中第一個商業(yè)化運營的測序平臺琼掠。
其中Illumina市場規(guī)模占到75%以上瓷蛙,主要包括Miseq艰猬,Hiseq冠桃。下面??就主要介紹它的PE(Pair End雙端)測序原理:
2.1文庫構(gòu)建
名詞:
flowcell: 測序反應(yīng)的載體/容器,1個flowcell有8個lane
lane: 測序反應(yīng)的平行泳道污茵,試劑添加迹蛤、洗脫等過程的發(fā)生位置
tile: 每次熒光掃描的位置襟士,肉眼是看不到的
雙端測序: 可能序列比較長有四五百bp逆趣,兩邊各測120-150bp
junction: 雙端測序中間一些沒有測到的區(qū)域
index(barcode):一個lane通常要測多個樣品章喉,每個樣品都加上特定的序列標簽,用于區(qū)分不同樣品部蛇。
flowcell構(gòu)造:一個lane包含兩列(swath)涯鲁,每一列有60個tile,每個tile會種下不同的cluster旭寿,每個tile在一次循環(huán)中會拍照4次(每個堿基一次)
打斷以后會出現(xiàn)末端不平整的情況,用酶補平混狠,所以現(xiàn)在的序列是平末端疾层。
完成補平以后予弧,在3'端使用酶加上一個特異的堿基A桌肴,加上A之后就可以利用互補配對的原則,加上adapter水醋,這個adpater可以分成兩個部分拄踪,一個部分是測序的時候需要用的引物序列蝇恶,另一部分是建庫擴增時候需要用的引物序列。
進行PCR擴增惶桐,使得我們的DNA樣品濃度足夠上機要求撮弧。
什么是插入片段潘懊?
reads1 與 reads2 不發(fā)生重疊
-
圖中是Pair-End(PE)測序,測的是兩個末端贿衍,得到的序列是Read1和Read2授舟,很多時候Read1+Read2的長度都是小于這個插入片段的長度的。在不測通的情況下贸辈,它中間一定有一段不明長度的序列我們無法測到奢啥,這段不被測到的序列有時被稱為Inner序列席吴,它的長度是Read1和Read2相距的距離。
imagereads1 與 reads2 發(fā)生重疊
-
測序讀長較長宴合,比如MiSeq的測序讀長可以到達250bp斜棚,PE測的話义钉,Read1+Read2就達到500bp拖刃,如果我們的建庫序列長度是400bp发绢,那么就會被測通墩朦,而且中間有約100bp是Read1和Read2重疊測到的區(qū)域劳吠。
image測通
它是Read重疊的進一步延伸蠢古,原因是相同的堕战,就是有些插入片段長度太短了昭灵,導致Read能夠完全跨越整個插入片段,比如圖里,所有長度小于100bp的插入片段吻谋,它們都會被測通骇两,而且還會直接測到片段兩端的接頭序列闸餐,這時就需要對產(chǎn)生的數(shù)據(jù)進行cut adapter。image
2.2 上樣
flowcell是用于吸附流動DNA片段的槽道失球,測序就在此進行聪轿。上面構(gòu)建好的文庫中的待測序列事先配置好一定的濃度音瓷,經(jīng)過這里的時候声邦,會在特異的化學試劑作用下蛇受,強力隨機地附著在lane上,與上面的短序列配對瞳腌。上樣的結(jié)果就是lane吸附住了沖過來的DNA各淀,并且可以在表面進行橋式PCR擴增抄课。
2.3 橋式PCR
第一輪擴增模版:flowcell表面固定的序列 --> 模版鏈
去雜:加入NaOH強堿性溶液使雙鏈DNA變性偷遗,互補鏈由于和lane上短序列強力連接固定住了般妙;模板鏈失去了雙鏈氫鍵連接,好似懸空,它會被洗脫蔬捷。
橋式形成: 加入緩沖溶液,互補鏈的p7‘和lane上的p7互補(但還是一個lane中的)就像下圖這樣(摘自illumina官網(wǎng))目的是快速擴增lane p7接頭連接的鏈罕容,也就是下圖中的Forward Strand旅择,它和我們的模版鏈是一致的昼牛。我們后來測序只用這一半悬垃。
橋式PCR: PCR彎成橋狀游昼,一輪橋式擴增一倍甘苍。
循環(huán): 大約35個循環(huán)后,最終每個DNA片段都將在各自的位置上集中成束烘豌,稱為cluster载庭,這是一群完全相同的序列。目的在于實現(xiàn)放大單一堿基的信號強度廊佩,滿足后期測序需求囚聚。
-
解鏈: 橋式PCR完成后,形成了很多的橋形的互補雙鏈标锄,再次強堿解鏈顽铸。這一次不再進行復制,而是利用一種酶--甲酰胺基嘧啶糖苷酶(Fpg)選擇性的切掉lane 上p5‘ 連接的鏈料皇,只留下了與lane p7連接的鏈即Forward Strand谓松。
imageimageimage
2.4 測序
雙端測序之Forward Strand:
先是primer結(jié)合到靠近p5的sequencing primer binding site1上,再加入特殊的dNTP【它的3‘ 羥基被疊氮基團替代践剂,因此每次只能添加一個dNTP鬼譬;還含有熒光基團,能激發(fā)不同顏色】逊脯;
在dNTP被添加到合成鏈上后优质,所有未使用的游離dNTP和DNA聚合酶會被洗脫掉;再加入激發(fā)熒光緩沖液军洼,用激光激發(fā)熒光信號巩螃,光學設(shè)備記錄熒光信號的記錄,計算機將光學信號轉(zhuǎn)化為測序堿基匕争,這一個循環(huán)就能測定flowcell上成千上萬的cluster避乏,這就實現(xiàn)了高通量。
再加入化學試劑淬滅熒光信號并使dNTP 3’ 疊氮基團變成羥基汗捡,這樣能繼續(xù)向下進行再加一個淑际,并且保證這個不再發(fā)出熒光畏纲。如此重復直至所有鏈的堿基序列被檢測出。得到了Forward Strand序列春缕。
-
因為一個cluster的序列是一樣的盗胀,所以理論上cluster的熒光顏色應(yīng)該一致。
imageIndex測序: 上面的循環(huán)結(jié)束后锄贼,read product被沖掉票灰,index1 primer和鏈上的index1 互補配對,進行index1的檢測宅荤。測完后屑迂,洗脫產(chǎn)物,得到index1 的序列冯键。接下來p5與lane上的p5‘配對惹盼,測得了index2,并洗脫惫确。
image雙端測序之Reverse Strand:
洗脫掉index2 產(chǎn)物后手报,還是一個橋式擴增,得到雙鏈改化,再變性得到原始Forward strand 和 新的Reverse Strand掩蛤, 除去測完的Forward strand。然后和測Forward一樣陈肛,也是先連接primer揍鸟,只是連接的位點是Primer Binding Site2,測完后得到reverse strand序列句旱。
single-end只將index阳藻,Primer binding site以及P7/P5添加到 fragamented DNA片段的一端,另一端直接連上P5/P7前翎,將片段固定在Flowcell上橋式PCR生成DNA簇稚配,然后單端測序讀取序列
為什么Illumina測序會有長度限制呢?
- 測序時港华,經(jīng)過長時間的PCR道川,會有不同步的情況。通俗一點講立宜,比如一開始1個cluster中是100個完全一樣的DNA鏈冒萄,但是經(jīng)過1輪增加堿基,其中99個都加入了1個堿基橙数,顯示了紅色尊流,另外1個沒有加入堿基,不顯示顏色灯帮。這時候整體為紅色崖技,我們可以順利得到結(jié)果逻住。隨后,在第2輪再加入堿基進行合成的時候迎献,就變成了瞎访,之前沒有加入的加入了1個堿基顯示紅色,剩下的99個顯示綠色吁恍,這個時候就會出現(xiàn)雜信號扒秸。當測序長度不斷延長,這個雜信號會越來越多冀瓦,最后很有可能出現(xiàn)伴奥,50個紅,50個綠色翼闽,這時候我們判斷不出來到底是什么堿基被合成拾徙。
2.測序過程中,使用的堿基是特殊處理的肄程,有一個非常大的熒光基團修飾锣吼。在使用DNA ploymerase的時候,酶的狀態(tài)也會受到底物的影響蓝厌,越來越差。
2.5 數(shù)據(jù)產(chǎn)生:
Hiseq2000測序儀
測序儀搭配了兩個flowcell古徒,簡稱雙流動槽拓提。比較經(jīng)典的Hiseq2500一次能產(chǎn)出700-800Gb數(shù)據(jù)(此處Gb為測序堿基數(shù),不同于字節(jié)數(shù)的Gb)
數(shù)據(jù)量=單端reads長度 * 單端reads個數(shù) * 2(PE)
測序深度=數(shù)據(jù)量大小 / 參考基因組大小
第三代測序技術(shù)
這是一個新的里程碑隧膘。以PacBio公司的SMRT和Oxford Nanopore Technologies的納米孔單分子測序技術(shù)為標志代态,被稱之為第三代測序技術(shù)。與前兩代相比疹吃,最大的特點就是單分子測序蹦疑,測序過程無需進行PCR擴增,超長讀長萨驶,平均達到10Kb-15Kb歉摧,是二代測序技術(shù)的100倍以上,值得注意的是在測序過程中這些序列的讀長也不再是相等的腔呜。
PacBio SMRT
-
PacBio SMRT技術(shù)其實也應(yīng)用了邊合成邊測序的思想叁温,并以SMRT芯片為測序載體(如同flowcell)『顺耄基本原理是: DNA聚合酶和模板結(jié)合膝但,用4色熒光標記A,C,G,T這4種堿基(即是dNTP)。在堿基的配對階段谤草,不同的堿基加入跟束,會發(fā)出不同的光莺奸,根據(jù)光的波長與峰值可判斷進入的堿基類型。
image
這個DNA聚合酶是實現(xiàn)超長讀長的關(guān)鍵之一冀宴,讀長主要跟酶的活性保持有關(guān)憾筏,它主要受激光對其造成的損傷所影響。PacBio SMRT技術(shù)的一個關(guān)鍵點是在于如何將反應(yīng)信號與周圍游離堿基的強大熒光背景區(qū)別出來花鹅。他們利用的是ZMW(零模波導孔)原理:如同微波爐壁上可看到的很多密集小孔氧腰。這些小孔的直徑是有嚴格要求的,如果直徑大于微波波長刨肃,能量就會在衍射效應(yīng)的作用下穿透面板從而泄露出來(光波的衍射效應(yīng))古拴,從而與周圍小孔相互干擾(光波的干涉)。如果孔徑能夠小于波長真友,那么能量就不會輻射到周圍黄痪,而是保持直線狀態(tài),從而可起到保護的作用盔然。同理桅打,在一個反應(yīng)管(SMRTCell:單分子實時反應(yīng)孔)中有許多這樣的圓形納米小孔,,即 ZMW(零模波導孔)愈案,外徑100多納米挺尾,比檢測激光波長小(數(shù)百納米),激光從底部打上去后不會穿透小孔進入上方的溶液區(qū)站绪,能量會被限制在一個小范圍(體積20X 10-21 L)里遭铺,正好足夠覆蓋需要檢測的部分,使得信號僅僅只是來自于這個小反應(yīng)區(qū)域恢准,孔外過多的游離核苷酸單體依然留在黑暗中魂挂,從而實現(xiàn)將背景噪音降到最低的目的。
- PacBio SMRT技術(shù)除了能夠檢測普通的堿基之外馁筐,還可以通過檢測相鄰兩個堿基之間的測序時間涂召,來檢測堿基的表觀修飾情況,如甲基化敏沉。因為假設(shè)某個堿基存在表觀修飾果正,則通過聚合酶時的速度會減慢,那么相鄰兩峰之間的距離會增大赦抖,我們可以通過這個時間上的差異來檢測表觀甲基化修飾等信息舱卡。
- SMRT技術(shù)的測序速度很快,每秒約10個dNTP队萤。但這么快的測序速度也帶來了一些明顯的缺點——測序錯誤率比較高(這幾乎是目前單分子測序技術(shù)的通猜肿丁),可以達到10%-15%要尔,而且以缺失序列和錯位居多舍杜,但好在它的出錯是隨機的新娜,并不會像第二代測序技術(shù)那樣存在一定的堿基偏向(PCR biasing),因此可以通過多次測序來進行有效糾錯既绩。
Oxford Nanopore
-
這個技術(shù)的關(guān)鍵點在于他們所設(shè)計的一種特殊納米孔概龄,孔內(nèi)共價結(jié)合分子接頭。當DNA分子通過納米孔時饲握,它們使電荷發(fā)生變化私杜,從而短暫地影響流過納米孔的電流強度(每種堿基所影響的電流變化幅度是不同的),最后高靈敏度的電子設(shè)備檢測到這些變化從而鑒定所通過的堿基救欧。
image 納米孔測序以及其他第三代測序技術(shù)衰粹,有可能會徹底地解決目前第二代測序平臺的諸多不足。另外笆怠,MinION的主要特點是:讀長很長铝耻,而且比PacBio的都長得多,基本都是在幾十kb上百kb以上蹬刷,最新的數(shù)據(jù)顯示可以達到900 kb瓢捉!錯誤率是5%-15%,也是隨機錯誤办成,MinION最大的特點除了極小的體積之外泡态,就是數(shù)據(jù)將是可實時讀取/的,并且起始DNA在測序過程中不被破壞诈火!這種納米孔單分子測序儀還有另一大特點兽赁,它能夠直接讀取出甲基化的胞嘧啶,而不必像二代測序方法那樣需要事先對基因組進行bisulfite(酸性亞硫酸鹽)處理冷守。這對于在基因組水平直接研究表觀遺傳相關(guān)現(xiàn)象有極大的幫助。
參考文章:
1.http://www.reibang.com/p/101c14c3a1d2
2.https://zhuanlan.zhihu.com/p/20702684
3.https://mp.weixin.qq.com/s/tWHWA-f1RnP_XWY66p12pg
4.https://mp.weixin.qq.com/s/9KUY43lD5miLdPZJKgRV0A
原作者:顫抖吧__小蟲子
鏈接:http://www.reibang.com/p/e6527ce46b0c