雖然三代測序現(xiàn)在已經(jīng)商用香伴,但是目前的主流還是二代測序,尤其是Illumina公司的測序方式更是大行其道。那么,下面我們從四個方面來說說illumina家的二代測序是怎么得到的生物數(shù)據(jù)充甚。
0、 基本原理
基于可逆終止的霸褒,熒光標記dNTP伴找,做邊合成邊測序
分為三步:
- 樣本準備 Sample Prep
- 成簇 Cluster Generation
- 測序 Sequencing
- 數(shù)據(jù)分析 Data Analysis
1、樣本準備 Sample Prep
通過不同實驗方法得到的樣品废菱,需要先提取樣本基因組中的DNA技矮,用超聲波將其隨機打斷箍鼓。然后使用酶將兩端補平析孽,使用 Klenow 酶在3‘ 端加一個 A 堿基(用于連接接頭序列)。為了后續(xù)擴增,測序分析梳凛,需要為這些DNA片段添加特定的接頭序列。接頭序列是已知的梳杏,大概有三種:
- sequencing binding site(綠)
- index(紅韧拒,黃)
- 流動池引物互補的序列(藍,紫)
添加完接頭序列后的DNA片段集合叫DNA文庫 (DNA library)十性,這樣就完成了樣品準備工作叛溢。
2、成簇 Cluster Generation
成簇是DNA片段被擴增的過程劲适,該過程在流動池 (Flowcell) 中完成楷掉。它是一片帶有8條通道(lanes)的玻璃載玻,每個通道內(nèi)表面附有兩種DNA引物霞势。
首先烹植,引物會與樣品中的DNA片段的接頭序列互補配對,固定在通道表面
通過聚合酶生成雜交片段的互補片段愕贡,然后加入NaOH堿溶液后草雕,雙鏈分子變性,原始模板鏈(左邊的鏈)被流動池中的液體洗去
加入中性液體用于中和堿溶液固以,剩下的單鏈拷貝鏈另一端的接頭就會與通道表面的引物結(jié)合墩虹,形成單鏈橋嘱巾。
同樣的,在聚合酶參與下诫钓,生成互補鏈旬昭,最終形成雙鏈橋
通過變性,DNA分子線性化菌湃,變?yōu)閮蓚€單鏈拷貝
它們又分別與自己配對的引物結(jié)合
重復這個循環(huán)稳懒,同時形成數(shù)百萬的簇。在這個過程中慢味,所有的DNA片段都會被克隆擴增场梆。
橋式擴增后,反向鏈會被切斷洗去纯路,僅留下正向鏈或油。為防止特異性結(jié)合重新形成單鏈橋,3‘端被封鎖
3驰唬、測序 Sequencing
首先顶岸,在Flowcell中加入熒光標記的dNTP和酶,由引物起始開始合成子鏈叫编。但是dNTP存在 3’端疊氮基會阻礙子鏈延伸辖佣,這使得每個循環(huán)只能測得一個堿基。合成完一個堿基后搓逾, Flowcell 通入液體洗掉多余的dNTP和酶卷谈,使用顯微鏡的激光掃描特征熒光信號。
熒光發(fā)射波長與信號強度一起決定了堿基的讀出霞篡,所有的DNA片段的一個堿基會被同時讀取世蔗。在大規(guī)模并行的過程中,機器讀取的圖像類似下面這樣
加入化學試劑將疊氮基團與熒光基團切除朗兵,然后 Flowcell 再通入熒光標記的dNTP和酶污淋,由引物起始開始合成一個堿基。不斷重復這個過程余掖,完成第一次讀取寸爆。
[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-0jKF4uPB-1570876048855)(C:\Users\ADMINI~1\AppData\Local\Temp\1545892612561.png)]
由于測序儀每次測序時的通量比較大,所以每次測得的序列可能不止一個樣本盐欺。為了去區(qū)分每個樣本及正負鏈赁豆,科學家構(gòu)建DNA文庫時,在接頭序列加入了的不同 index(或 barcode)來區(qū)分來源找田。
首先歌憨,在完成第一次讀取后,復制出的鏈會被洗去
index 片段引物被引入并與模板雜交墩衙,完成序列讀取后被洗去务嫡。這樣讀取到的序列與開始時已知的index比對后就可以給測得的序列貼上標簽甲抖,方便后續(xù)分析。
Paired-end測序已經(jīng)是現(xiàn)在的主流心铃,它提高了測序長度的同時准谚,又可以為結(jié)構(gòu)變異分析提供新方法。要完成雙末端測序去扣,首先要將模板鏈3’去保護柱衔,模板折疊,index片段引入
在聚合酶參與下形成雙鏈橋
然后變性愉棱,恢復為單鏈唆铐。注意,這次是將正向鏈切除并洗去奔滑,只留下反向鏈
反向鏈以測序引物為起始艾岂,與正向鏈類似,經(jīng)過多個循環(huán)后完成讀取朋其。
數(shù)據(jù)分析 Data Analysis
測序完成后會產(chǎn)生數(shù)百萬個 reads王浴,基于在樣品準備時構(gòu)建的 index 分類來自不同樣本的序列。對于每個樣品來說梅猿,具有相似延伸的堿基被聚在一起氓辣。正向和反向read配對生成連續(xù)序列。這些序列通過與參考基因組匹配后袱蚓,實現(xiàn)完整序列的構(gòu)建钞啸。