HiFi測序原理
PacBio測序即單分子實時測序馁菜,其原理是:當DNA與聚合酶形成的復合物被ZMW(零模波導孔)捕獲后缺脉,4種不同熒光標記的dNTP通過布朗運動隨機進入檢測區(qū)域并與聚合酶結(jié)合尉桩,與模板匹配的堿基生成化學鍵的時間遠遠長于其他堿基停留的時間瞳筏。因此卓缰,統(tǒng)計熒光信息存在時間的長短喇辽,可區(qū)分匹配的堿基與游離堿基晾捏。通過統(tǒng)計4種熒光信息與時間的關(guān)系圖丁逝,即可測序DNA模板序列。
HiFi 與CLR 比對
PacBio平臺有CLR和HiFi兩種測序模式。
CLR測序模式稱為超長測序模式(插入片段30kb以上),產(chǎn)生的數(shù)據(jù)是基于單循環(huán)測序的結(jié)果农尖,一次插入片段只測序一次,準確度和PacBio常規(guī)測序保持一致,在85%左右雏亚。CLR測序可以利用自身的數(shù)據(jù)進行糾錯,當數(shù)據(jù)深度達到50X左右時摩钙,一致性序列準確性超過99.999%(QV50)罢低。
HiFi的準確度超過Q20(99%),并且還能兼顧超過10kb胖笛,甚至可達20kb的長讀長測序模式网持。由于HiFi插入片段只有10-20kb, 因此測序時酶會繞著DNA模板(插入片段)進行滾環(huán)測序,即插入片段會被多次測序长踊。這樣單詞測序中造成的隨機測序錯誤功舀,可以通過算法進行自我糾錯校正,最終得到高精度的HiFi Reads身弊。