測序原理:一代二代三代測序原理詳解

1. 一代測序(Sanger sequencing)

雙脫氧鏈終止法采用DNA復制原理耻台。 Sanger測序反應(yīng)體系中包括目標DNA片段盆耽、脫氧三磷酸核苷酸(dNTP)征字、雙脫氧三磷酸核苷酸(ddNTP)匙姜、測序引物及DNA聚合酶等。 測序反應(yīng)的核心就是其使用的ddNTP:由于缺少3'-OH基團框杜,不具有與另一個dNTP連接形成磷酸二酯鍵的能力咪辱,這些ddNTP可用來中止DNA鏈的延伸油狂。此外专筷,這些ddNTP上連接有放射性同位素或熒光標記基團磷蛹,因此可以被自動化的儀器或凝膠成像系統(tǒng)所檢測到味咳。

設(shè)置四個反應(yīng)體系1-4槽驶,分別加入引物掂铐、DNA聚合酶堡纬、四種dNTP蒿秦、一定比例的ddNTP(帶有放射性標記)例如1中是ddATP棍鳖,它就負責測定T堿基的位置镀裤;依次2是ddCTP禽绪,3是ddTTP旧困, 4是ddGTP吼具。假如擴增過程中ddATP遇到了T位點拗盒,就結(jié)合并終止(因為ddNTP的2‘和3'都沒有羥基),一段時間內(nèi)大量的ddNTP會結(jié)合完所有測序位點陡蝇。

最后利用凝膠電泳和放射自顯影只能看到帶有熒光標記的ddNTP登夫,他們的排列順序先利用電泳條帶前后關(guān)系確定下悼嫉,再用A-T, T-A, C-G, G-C關(guān)系反轉(zhuǎn)一下,就能知道我們的測序序列蹋凝。

image

一代測序技術(shù)的主要特點就是測序讀長可達1000bp鳍寂,準確性高達99.999%迄汛,二三代所不能及)鞍爱,但它的通量低睹逃,成本高。目前一代測序在驗證序列(就是平時送公司測序返回來自己blast的那些)以及驗證基因組組裝完整性方面都是金標準佑笋。

2. 二代測序(sequencing by synthesis,SBS)

Roche公司的454技術(shù)蒋纬、illumina公司的Solexa/Hiseq技術(shù)和ABI公司的SOLID技術(shù)標志第二代測序技術(shù)誕生颠锉。其中Roche公司的454測序系統(tǒng)是第二代測序技術(shù)中第一個商業(yè)化運營的測序平臺琼掠。
其中Illumina市場規(guī)模占到75%以上瓷蛙,主要包括Miseq艰猬,Hiseq冠桃。下面??就主要介紹它的PE(Pair End雙端)測序原理:

2.1文庫構(gòu)建

名詞:
flowcell: 測序反應(yīng)的載體/容器,1個flowcell有8個lane
lane: 測序反應(yīng)的平行泳道污茵,試劑添加迹蛤、洗脫等過程的發(fā)生位置
tile: 每次熒光掃描的位置襟士,肉眼是看不到的
雙端測序: 可能序列比較長有四五百bp逆趣,兩邊各測120-150bp
junction: 雙端測序中間一些沒有測到的區(qū)域
index(barcode):一個lane通常要測多個樣品章喉,每個樣品都加上特定的序列標簽,用于區(qū)分不同樣品部蛇。
flowcell構(gòu)造:一個lane包含兩列(swath)涯鲁,每一列有60個tile,每個tile會種下不同的cluster旭寿,每個tile在一次循環(huán)中會拍照4次(每個堿基一次)

image

打斷以后會出現(xiàn)末端不平整的情況,用酶補平混狠,所以現(xiàn)在的序列是平末端疾层。
完成補平以后予弧,在3'端使用酶加上一個特異的堿基A桌肴,加上A之后就可以利用互補配對的原則,加上adapter水醋,這個adpater可以分成兩個部分拄踪,一個部分是測序的時候需要用的引物序列蝇恶,另一部分是建庫擴增時候需要用的引物序列。
進行PCR擴增惶桐,使得我們的DNA樣品濃度足夠上機要求撮弧。

image
image
什么是插入片段潘懊?

reads1 與 reads2 不發(fā)生重疊

  • 圖中是Pair-End(PE)測序,測的是兩個末端贿衍,得到的序列是Read1和Read2授舟,很多時候Read1+Read2的長度都是小于這個插入片段的長度的。在不測通的情況下贸辈,它中間一定有一段不明長度的序列我們無法測到奢啥,這段不被測到的序列有時被稱為Inner序列席吴,它的長度是Read1和Read2相距的距離。

    image

    reads1 與 reads2 發(fā)生重疊

  • 測序讀長較長宴合,比如MiSeq的測序讀長可以到達250bp斜棚,PE測的話义钉,Read1+Read2就達到500bp拖刃,如果我們的建庫序列長度是400bp发绢,那么就會被測通墩朦,而且中間有約100bp是Read1和Read2重疊測到的區(qū)域劳吠。

    image

    測通
    它是Read重疊的進一步延伸蠢古,原因是相同的堕战,就是有些插入片段長度太短了昭灵,導致Read能夠完全跨越整個插入片段,比如圖里,所有長度小于100bp的插入片段吻谋,它們都會被測通骇两,而且還會直接測到片段兩端的接頭序列闸餐,這時就需要對產(chǎn)生的數(shù)據(jù)進行cut adapter。

    image
2.2 上樣

flowcell是用于吸附流動DNA片段的槽道失球,測序就在此進行聪轿。上面構(gòu)建好的文庫中的待測序列事先配置好一定的濃度音瓷,經(jīng)過這里的時候声邦,會在特異的化學試劑作用下蛇受,強力隨機地附著在lane上,與上面的短序列配對瞳腌。上樣的結(jié)果就是lane吸附住了沖過來的DNA各淀,并且可以在表面進行橋式PCR擴增抄课。

2.3 橋式PCR
  • 第一輪擴增模版:flowcell表面固定的序列 --> 模版鏈

  • 去雜:加入NaOH強堿性溶液使雙鏈DNA變性偷遗,互補鏈由于和lane上短序列強力連接固定住了般妙;模板鏈失去了雙鏈氫鍵連接,好似懸空,它會被洗脫蔬捷。

  • 橋式形成: 加入緩沖溶液,互補鏈的p7‘和lane上的p7互補(但還是一個lane中的)就像下圖這樣(摘自illumina官網(wǎng))目的是快速擴增lane p7接頭連接的鏈罕容,也就是下圖中的Forward Strand旅择,它和我們的模版鏈是一致的昼牛。我們后來測序只用這一半悬垃。

  • 橋式PCR: PCR彎成橋狀游昼,一輪橋式擴增一倍甘苍。

  • 循環(huán): 大約35個循環(huán)后,最終每個DNA片段都將在各自的位置上集中成束烘豌,稱為cluster载庭,這是一群完全相同的序列。目的在于實現(xiàn)放大單一堿基的信號強度廊佩,滿足后期測序需求囚聚。

  • 解鏈: 橋式PCR完成后,形成了很多的橋形的互補雙鏈标锄,再次強堿解鏈顽铸。這一次不再進行復制,而是利用一種酶--甲酰胺基嘧啶糖苷酶(Fpg)選擇性的切掉lane 上p5‘ 連接的鏈料皇,只留下了與lane p7連接的鏈即Forward Strand谓松。

    image
    image
    image
2.4 測序

雙端測序之Forward Strand

image
  • 先是primer結(jié)合到靠近p5的sequencing primer binding site1上,再加入特殊的dNTP【它的3‘ 羥基被疊氮基團替代践剂,因此每次只能添加一個dNTP鬼譬;還含有熒光基團,能激發(fā)不同顏色】逊脯;

  • 在dNTP被添加到合成鏈上后优质,所有未使用的游離dNTP和DNA聚合酶會被洗脫掉;再加入激發(fā)熒光緩沖液军洼,用激光激發(fā)熒光信號巩螃,光學設(shè)備記錄熒光信號的記錄,計算機將光學信號轉(zhuǎn)化為測序堿基匕争,這一個循環(huán)就能測定flowcell上成千上萬的cluster避乏,這就實現(xiàn)了高通量。

  • 再加入化學試劑淬滅熒光信號并使dNTP 3’ 疊氮基團變成羥基汗捡,這樣能繼續(xù)向下進行再加一個淑际,并且保證這個不再發(fā)出熒光畏纲。如此重復直至所有鏈的堿基序列被檢測出。得到了Forward Strand序列春缕。

  • 因為一個cluster的序列是一樣的盗胀,所以理論上cluster的熒光顏色應(yīng)該一致。

    image

    Index測序: 上面的循環(huán)結(jié)束后锄贼,read product被沖掉票灰,index1 primer和鏈上的index1 互補配對,進行index1的檢測宅荤。測完后屑迂,洗脫產(chǎn)物,得到index1 的序列冯键。接下來p5與lane上的p5‘配對惹盼,測得了index2,并洗脫惫确。

    image

    雙端測序之Reverse Strand:
    洗脫掉index2 產(chǎn)物后手报,還是一個橋式擴增,得到雙鏈改化,再變性得到原始Forward strand 和 新的Reverse Strand掩蛤, 除去測完的Forward strand。然后和測Forward一樣陈肛,也是先連接primer揍鸟,只是連接的位點是Primer Binding Site2,測完后得到reverse strand序列句旱。

single-end只將index阳藻,Primer binding site以及P7/P5添加到 fragamented DNA片段的一端,另一端直接連上P5/P7前翎,將片段固定在Flowcell上橋式PCR生成DNA簇稚配,然后單端測序讀取序列

為什么Illumina測序會有長度限制呢?

  1. 測序時港华,經(jīng)過長時間的PCR道川,會有不同步的情況。通俗一點講立宜,比如一開始1個cluster中是100個完全一樣的DNA鏈冒萄,但是經(jīng)過1輪增加堿基,其中99個都加入了1個堿基橙数,顯示了紅色尊流,另外1個沒有加入堿基,不顯示顏色灯帮。這時候整體為紅色崖技,我們可以順利得到結(jié)果逻住。隨后,在第2輪再加入堿基進行合成的時候迎献,就變成了瞎访,之前沒有加入的加入了1個堿基顯示紅色,剩下的99個顯示綠色吁恍,這個時候就會出現(xiàn)雜信號扒秸。當測序長度不斷延長,這個雜信號會越來越多冀瓦,最后很有可能出現(xiàn)伴奥,50個紅,50個綠色翼闽,這時候我們判斷不出來到底是什么堿基被合成拾徙。
    2.測序過程中,使用的堿基是特殊處理的肄程,有一個非常大的熒光基團修飾锣吼。在使用DNA ploymerase的時候,酶的狀態(tài)也會受到底物的影響蓝厌,越來越差。
2.5 數(shù)據(jù)產(chǎn)生:

Hiseq2000測序儀
測序儀搭配了兩個flowcell古徒,簡稱雙流動槽拓提。比較經(jīng)典的Hiseq2500一次能產(chǎn)出700-800Gb數(shù)據(jù)(此處Gb為測序堿基數(shù),不同于字節(jié)數(shù)的Gb)
數(shù)據(jù)量=單端reads長度 * 單端reads個數(shù) * 2(PE)
測序深度=數(shù)據(jù)量大小 / 參考基因組大小

image

第三代測序技術(shù)

這是一個新的里程碑隧膘。以PacBio公司的SMRT和Oxford Nanopore Technologies的納米孔單分子測序技術(shù)為標志代态,被稱之為第三代測序技術(shù)。與前兩代相比疹吃,最大的特點就是單分子測序蹦疑,測序過程無需進行PCR擴增,超長讀長萨驶,平均達到10Kb-15Kb歉摧,是二代測序技術(shù)的100倍以上,值得注意的是在測序過程中這些序列的讀長也不再是相等的腔呜。

PacBio SMRT
  • PacBio SMRT技術(shù)其實也應(yīng)用了邊合成邊測序的思想叁温,并以SMRT芯片為測序載體(如同flowcell)『顺耄基本原理是: DNA聚合酶和模板結(jié)合膝但,用4色熒光標記A,C,G,T這4種堿基(即是dNTP)。在堿基的配對階段谤草,不同的堿基加入跟束,會發(fā)出不同的光莺奸,根據(jù)光的波長與峰值可判斷進入的堿基類型。

    image

這個DNA聚合酶是實現(xiàn)超長讀長的關(guān)鍵之一冀宴,讀長主要跟酶的活性保持有關(guān)憾筏,它主要受激光對其造成的損傷所影響。PacBio SMRT技術(shù)的一個關(guān)鍵點是在于如何將反應(yīng)信號與周圍游離堿基的強大熒光背景區(qū)別出來花鹅。他們利用的是ZMW(零模波導孔)原理:如同微波爐壁上可看到的很多密集小孔氧腰。這些小孔的直徑是有嚴格要求的,如果直徑大于微波波長刨肃,能量就會在衍射效應(yīng)的作用下穿透面板從而泄露出來(光波的衍射效應(yīng))古拴,從而與周圍小孔相互干擾(光波的干涉)。如果孔徑能夠小于波長真友,那么能量就不會輻射到周圍黄痪,而是保持直線狀態(tài),從而可起到保護的作用盔然。同理桅打,在一個反應(yīng)管(SMRTCell:單分子實時反應(yīng)孔)中有許多這樣的圓形納米小孔,,即 ZMW(零模波導孔)愈案,外徑100多納米挺尾,比檢測激光波長小(數(shù)百納米),激光從底部打上去后不會穿透小孔進入上方的溶液區(qū)站绪,能量會被限制在一個小范圍(體積20X 10-21 L)里遭铺,正好足夠覆蓋需要檢測的部分,使得信號僅僅只是來自于這個小反應(yīng)區(qū)域恢准,孔外過多的游離核苷酸單體依然留在黑暗中魂挂,從而實現(xiàn)將背景噪音降到最低的目的。

  • PacBio SMRT技術(shù)除了能夠檢測普通的堿基之外馁筐,還可以通過檢測相鄰兩個堿基之間的測序時間涂召,來檢測堿基的表觀修飾情況,如甲基化敏沉。因為假設(shè)某個堿基存在表觀修飾果正,則通過聚合酶時的速度會減慢,那么相鄰兩峰之間的距離會增大赦抖,我們可以通過這個時間上的差異來檢測表觀甲基化修飾等信息舱卡。
  • SMRT技術(shù)的測序速度很快,每秒約10個dNTP队萤。但這么快的測序速度也帶來了一些明顯的缺點——測序錯誤率比較高(這幾乎是目前單分子測序技術(shù)的通猜肿丁),可以達到10%-15%要尔,而且以缺失序列和錯位居多舍杜,但好在它的出錯是隨機的新娜,并不會像第二代測序技術(shù)那樣存在一定的堿基偏向(PCR biasing),因此可以通過多次測序來進行有效糾錯既绩。
Oxford Nanopore
  • 這個技術(shù)的關(guān)鍵點在于他們所設(shè)計的一種特殊納米孔概龄,孔內(nèi)共價結(jié)合分子接頭。當DNA分子通過納米孔時饲握,它們使電荷發(fā)生變化私杜,從而短暫地影響流過納米孔的電流強度(每種堿基所影響的電流變化幅度是不同的),最后高靈敏度的電子設(shè)備檢測到這些變化從而鑒定所通過的堿基救欧。

    image
  • 納米孔測序以及其他第三代測序技術(shù)衰粹,有可能會徹底地解決目前第二代測序平臺的諸多不足。另外笆怠,MinION的主要特點是:讀長很長铝耻,而且比PacBio的都長得多,基本都是在幾十kb上百kb以上蹬刷,最新的數(shù)據(jù)顯示可以達到900 kb瓢捉!錯誤率是5%-15%,也是隨機錯誤办成,MinION最大的特點除了極小的體積之外泡态,就是數(shù)據(jù)將是可實時讀取/的,并且起始DNA在測序過程中不被破壞诈火!這種納米孔單分子測序儀還有另一大特點兽赁,它能夠直接讀取出甲基化的胞嘧啶,而不必像二代測序方法那樣需要事先對基因組進行bisulfite(酸性亞硫酸鹽)處理冷守。這對于在基因組水平直接研究表觀遺傳相關(guān)現(xiàn)象有極大的幫助。

參考文章:

1.http://www.reibang.com/p/101c14c3a1d2
2.https://zhuanlan.zhihu.com/p/20702684
3.https://mp.weixin.qq.com/s/tWHWA-f1RnP_XWY66p12pg
4.https://mp.weixin.qq.com/s/9KUY43lD5miLdPZJKgRV0A

原作者:顫抖吧__小蟲子
鏈接:http://www.reibang.com/p/e6527ce46b0c

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末惊科,一起剝皮案震驚了整個濱河市拍摇,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌馆截,老刑警劉巖充活,帶你破解...
    沈念sama閱讀 217,406評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異蜡娶,居然都是意外死亡混卵,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,732評論 3 393
  • 文/潘曉璐 我一進店門窖张,熙熙樓的掌柜王于貴愁眉苦臉地迎上來幕随,“玉大人,你說我怎么就攤上這事宿接∽富矗” “怎么了辕录?”我有些...
    開封第一講書人閱讀 163,711評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長梢卸。 經(jīng)常有香客問我走诞,道長,這世上最難降的妖魔是什么蛤高? 我笑而不...
    開封第一講書人閱讀 58,380評論 1 293
  • 正文 為了忘掉前任蚣旱,我火速辦了婚禮,結(jié)果婚禮上戴陡,老公的妹妹穿的比我還像新娘塞绿。我一直安慰自己,他們只是感情好猜欺,可當我...
    茶點故事閱讀 67,432評論 6 392
  • 文/花漫 我一把揭開白布位隶。 她就那樣靜靜地躺著,像睡著了一般开皿。 火紅的嫁衣襯著肌膚如雪涧黄。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,301評論 1 301
  • 那天赋荆,我揣著相機與錄音笋妥,去河邊找鬼。 笑死窄潭,一個胖子當著我的面吹牛春宣,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播嫉你,決...
    沈念sama閱讀 40,145評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼月帝,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了幽污?” 一聲冷哼從身側(cè)響起嚷辅,我...
    開封第一講書人閱讀 39,008評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎距误,沒想到半個月后簸搞,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,443評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡准潭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,649評論 3 334
  • 正文 我和宋清朗相戀三年趁俊,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片刑然。...
    茶點故事閱讀 39,795評論 1 347
  • 序言:一個原本活蹦亂跳的男人離奇死亡寺擂,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情沽讹,我是刑警寧澤般卑,帶...
    沈念sama閱讀 35,501評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站爽雄,受9級特大地震影響蝠检,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜挚瘟,卻給世界環(huán)境...
    茶點故事閱讀 41,119評論 3 328
  • 文/蒙蒙 一叹谁、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧乘盖,春花似錦焰檩、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,731評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至穿扳,卻和暖如春衩侥,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背矛物。 一陣腳步聲響...
    開封第一講書人閱讀 32,865評論 1 269
  • 我被黑心中介騙來泰國打工茫死, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人履羞。 一個月前我還...
    沈念sama閱讀 47,899評論 2 370
  • 正文 我出身青樓峦萎,卻偏偏與公主長得像,于是被迫代替她去往敵國和親忆首。 傳聞我的和親對象是個殘疾皇子爱榔,可洞房花燭夜當晚...
    茶點故事閱讀 44,724評論 2 354