[TOC]
文中1、2自劉小澤處學習拂玻,http://www.reibang.com/p/101c14c3a1d2
學習自相見很不晚http://www.reibang.com/p/0ae1dc30bb04
1.Sanger測序
每次測一條,溶液中他的復制本很多,將溶液分成四份蚤霞,
-
加入原料:
原材料 功能 備注 ddNTP(放射性標記) 鏈終止,并指示堿基類型 4種ddNTP到4份溶液 dNTP 鏈增長 4份一樣 primer 鏈增長 4份一樣 DNA polymerase 鏈增長 4份一樣
由于復制本大洒擦,成千上萬亚隅,而ddNTP 與DNA單鏈的結(jié)合是隨機的,因此會產(chǎn)生長度不一致的復制半成品
- 電泳區(qū)分長度
- 熒光標記指示堿基類型
優(yōu)點:
- 精度高:99.999%
- 讀長長:1000bp
缺點:
- 酶活性不能一直保持倍奢,因此1000bp之后測序準確率就會急速下降朴上。
- 一次只能測一條鏈,無法高通量
- 成本高
2.NGS
第二代測序(NGS)技術卒煞,主要學習基于Illumina的邊合成邊測序(Sequence by Synthesis, SBS)技術
2.1 反應裝置
從大到小痪宰,層級劃分
- flowcell:NGS測序反應的基本容器
- lane*8:測序反應的平行泳道,試劑添加畔裕、洗脫的發(fā)生未知
- swath*2:衣撬?
- tile*60:cluster generation的場所,每次熒光掃描的位置扮饶,肉眼不可見
2.2 SBS反應過程
2.2.1 將DNA隨機打斷成DNA片段(fragment)
或者叫構建DNA文庫淮韭。
- DNA molecules =超聲波==>300-500bp fragments
- 酶補平為平末端
- 3‘端加一個A堿基(方便adapter接上,他的3’端有一個T堿基)
- 兩端加上互補配對的adapter
- 其實還有其他的贴届,Primer binding site靠粪,index(barcode)等
- P7和P5末端---(注意:tile上為P7和P5‘蜡吧,因此只有P5端能結(jié)合到tile)
5'端-P5-index2-Adapter-引物結(jié)合位點1-
-fragment-
-引物結(jié)合位點2-Adapter-index1-P7-3'端
- PCR擴增
- 單鏈DNA文庫
2.2.2 將DNA fragment加到flowcell上
將文庫的待測序列實現(xiàn)配好一定濃度,經(jīng)過lane的時候占键,會在特異的化學試劑作用下昔善,強力隨機附著在lane上(tile上)。
2.2.3 Cluster generation
通過橋式PCR進行簇生成畔乙,測序使用的是tile上P7生成的鏈
-
擴增模板:只有待測序列的P5 端結(jié)合到tile上
- tile上的P5’ 鏈增長君仆,成雙鏈
img 去雜:NaOH強堿溶液變性,洗脫掉待測序列牲距,留下P5‘ 鏈
-
橋式形成:加入緩沖液返咱,P5' 鏈的P7’ 端與tile上的P7結(jié)合,成橋牍鞠,復制成雙鏈咖摹!
img PCR,每個fragment會在一定區(qū)域內(nèi)成簇
-
強堿解鏈难述,甲酰胺基嘧啶糖苷酶(Fpg)選擇性的切掉lane 上p5‘ 連接的鏈萤晴,只留下了與lane p7連接的鏈即Forward Strand
img
2.2.4 雙末端測序(PE seq)
一次加入一個熒光堿基,用完失效
2.2.4.1.第一輪-Forward Strand
- 加入primer到靠近P5端(現(xiàn)在P5端在上面)的primer binding
site1上
加入熒光堿基
該堿基的接有熒光基團胁后,用于發(fā)光并抑制鏈增長
拍照
減去熒光基團并洗脫(或店读?加入化學試劑淬滅熒光信號并使dNTP 3’ 疊氮基團變成羥基),再次加入熒光堿基攀芯,重復
2.2.4.2 index1檢測
- P7端index1檢測
洗脫掉第一輪的產(chǎn)物(read product)屯断,然后加入index1 primer與P7端index1互補配對。測完后洗脫產(chǎn)物
- P5端index2檢測
P5與index2 primer互補配對侣诺,測完后洗脫
2.2.4.3 第二輪-Reverse Strand
此時為橋式殖演,擴增成雙鏈,變性成單鏈紧武,分別結(jié)合在tile上的P5‘ 和P7。出去Forward Strand敏储。測Reverse Strand之后的流程與第一輪類似阻星。
2.2.5 單末端測序(SE seq)
single-end只將index,Primer binding site以及P7/P5添加到 fragment 的一端已添,另一端直接連上P5/P7妥箕,將片段固定在Flowcell上橋式PCR生成DNA簇,然后單端測序讀取序列
3.幾個名詞
3.1 基因組重測序Genome Re-sequencing
全基因組重測序是對基因組序列已知的個體進行基因組測序更舞,并在個體或群體水平上進行差異性分析的方法畦幢。隨著基因組測序成本的不斷降低,人類疾病的致病突變研究由外顯子區(qū)域擴大到全基因組范圍缆蝉。通過構建不同長度的插入片段文庫和短序列宇葱、雙末端測序相結(jié)合的策略進行高通量測序瘦真,實現(xiàn)在全基因組水平上檢測疾病關聯(lián)的常見、低頻黍瞧、甚至是罕見的突變位點诸尽,以及結(jié)構變異等,具有重大的科研和產(chǎn)業(yè)價值印颤。
3.2 從頭測序 de novo sequencing
de novo測序也稱為從頭測序:其不需要任何現(xiàn)有的序列資料就可以對某個物種進行測序您机,利用生物信息學分析手段對序列進行拼接,組裝年局,從而獲得該物種的基因組圖譜际看。獲得一個物種的全基因組序列是加快對此物種了解的重要捷徑。隨著新一代測序技術的飛速發(fā)展矢否,基因組測序所需的成本和時間較傳統(tǒng)技術都大大降低仲闽,大規(guī)模基因組測序漸入佳境兴喂,基因組學研究也迎來新的發(fā)展契機和革命性突破蔼囊。利用新一代高通量、高效率測序技術以及強大的生物信息分析能力衣迷,可以高效畏鼓、低成本地測定并分析所有生物的基因組序列。
3.3 全外顯子測序whole exon sequencing
外顯子組測序是指利用序列捕獲技術將全基因組外顯子區(qū)域DNA捕捉并富集后進行高通量測序的基因組分析方法壶谒。外顯子測序相對于基因組重測序成本較低云矫,對研究已知基因的SNP、Indel等具有較大的優(yōu)勢汗菜,但無法研究基因組結(jié)構變異如染色體斷裂重組等让禀。
3.4 ChIP-Seq
染色質(zhì)免疫共沉淀技術(ChromatinImmunoprecipitation,ChIP)也稱結(jié)合位點分析法陨界,是研究體內(nèi)蛋白質(zhì)與DNA相互作用的有力工具巡揍,通常用于轉(zhuǎn)錄因子結(jié)合位點或組蛋白特異性修飾位點的研究。將ChIP與第二代測序技術相結(jié)合的ChIP-Seq技術菌瘪,能夠高效地在全基因組范圍內(nèi)檢測與組蛋白腮敌、轉(zhuǎn)錄因子等互作的DNA區(qū)段。ChIP-Seq的原理是:首先通過染色質(zhì)免疫共沉淀技術(ChIP)特異性地富集目的蛋白結(jié)合的DNA片段俏扩,并對其進行純化與文庫構建糜工;然后對富集得到的DNA片段進行高通量測序。研究人員通過將獲得的數(shù)百萬條序列標簽精確定位到基因組上录淡,從而獲得全基因組范圍內(nèi)與組蛋白捌木、轉(zhuǎn)錄因子等互作的DNA區(qū)段信息。
3.5 SNP和SNV
單核苷酸多態(tài)性singlenucleotide polymorphism嫉戚,SNP 或單核苷酸位點變異SNV刨裆。個體間基因組DNA序列同一位置單個核苷酸變異(替代澈圈、插入或缺失)所引起的多態(tài)性。不同物種崔拥、個體基因組DNA序列同一位置上的單個核苷酸存在差別的現(xiàn)象极舔。有這種差別的基因座、DNA序列等可作為基因組作圖的標志链瓦。人基因組上平均約每1000個核苷酸即可能出現(xiàn)1個單核苷酸多態(tài)性的變化拆魏,其中有些單核苷酸多態(tài)性可能與疾病有關,但可能大多數(shù)與疾病無關慈俯。單核苷酸多態(tài)性是研究人類家族和動植物品系遺傳變異的重要依據(jù)渤刃。在研究癌癥基因組變異時,相對于正常組織贴膘,癌癥中特異的單核苷酸變異是一種體細胞突變(somatic mutation)卖子,稱做SNV。
3.6 測序深度和覆蓋度
測序深度是指測序得到的總堿基數(shù)與待測基因組大小的比值刑峡。假設一個基因大小為2M洋闽,測序深度為10X,那么獲得的總數(shù)據(jù)量為20M突梦。覆蓋度是指測序獲得的序列占整個基因組的比例诫舅。由于基因組中的高GC、重復序列等復雜結(jié)構的存在宫患,測序最終拼接組裝獲得的序列往往無法覆蓋有所的區(qū)域刊懈,這部分沒有獲得的區(qū)域就稱為Gap。例如一個細菌基因組測序娃闲,覆蓋度是98%虚汛,那么還有2%的序列區(qū)域是沒有通過測序獲得的。