Day7--測序基礎知識

[TOC]

文中1、2自劉小澤處學習拂玻,http://www.reibang.com/p/101c14c3a1d2
學習自相見很不晚http://www.reibang.com/p/0ae1dc30bb04

1.Sanger測序

每次測一條,溶液中他的復制本很多,將溶液分成四份蚤霞,

  • 加入原料:

    原材料 功能 備注
    ddNTP(放射性標記) 鏈終止,并指示堿基類型 4種ddNTP到4份溶液
    dNTP 鏈增長 4份一樣
    primer 鏈增長 4份一樣
    DNA polymerase 鏈增長 4份一樣

由于復制本大洒擦,成千上萬亚隅,而ddNTP 與DNA單鏈的結(jié)合是隨機的,因此會產(chǎn)生長度不一致的復制半成品

  • 電泳區(qū)分長度
  • 熒光標記指示堿基類型

優(yōu)點:

  1. 精度高:99.999%
  2. 讀長長:1000bp

缺點:

  1. 酶活性不能一直保持倍奢,因此1000bp之后測序準確率就會急速下降朴上。
  2. 一次只能測一條鏈,無法高通量
  3. 成本高

2.NGS

第二代測序(NGS)技術卒煞,主要學習基于Illumina的邊合成邊測序(Sequence by Synthesis, SBS)技術

2.1 反應裝置

從大到小痪宰,層級劃分

  • flowcell:NGS測序反應的基本容器
  • lane*8:測序反應的平行泳道,試劑添加畔裕、洗脫的發(fā)生未知
  • swath*2:衣撬?
  • tile*60:cluster generation的場所,每次熒光掃描的位置扮饶,肉眼不可見

2.2 SBS反應過程

2.2.1 將DNA隨機打斷成DNA片段(fragment)

或者叫構建DNA文庫淮韭。

  • DNA molecules =超聲波==>300-500bp fragments
  • 酶補平為平末端
  • 3‘端加一個A堿基(方便adapter接上,他的3’端有一個T堿基)
  • 兩端加上互補配對的adapter
    • 其實還有其他的贴届,Primer binding site靠粪,index(barcode)等
  • P7和P5末端---(注意:tile上為P7和P5‘蜡吧,因此只有P5端能結(jié)合到tile)
5'端-P5-index2-Adapter-引物結(jié)合位點1-
-fragment-
-引物結(jié)合位點2-Adapter-index1-P7-3'端
  • PCR擴增
  • 單鏈DNA文庫

2.2.2 將DNA fragment加到flowcell上

將文庫的待測序列實現(xiàn)配好一定濃度,經(jīng)過lane的時候占键,會在特異的化學試劑作用下昔善,強力隨機附著在lane上(tile上)。

2.2.3 Cluster generation

通過橋式PCR進行簇生成畔乙,測序使用的是tile上P7生成的鏈

  • 擴增模板:只有待測序列的P5 端結(jié)合到tile上

    • tile上的P5’ 鏈增長君仆,成雙鏈
    img
  • 去雜:NaOH強堿溶液變性,洗脫掉待測序列牲距,留下P5‘ 鏈

  • 橋式形成:加入緩沖液返咱,P5' 鏈的P7’ 端與tile上的P7結(jié)合,成橋牍鞠,復制成雙鏈咖摹!

    img
  • PCR,每個fragment會在一定區(qū)域內(nèi)成簇

  • 強堿解鏈难述,甲酰胺基嘧啶糖苷酶(Fpg)選擇性的切掉lane 上p5‘ 連接的鏈萤晴,只留下了與lane p7連接的鏈即Forward Strand

    img

2.2.4 雙末端測序(PE seq)

一次加入一個熒光堿基,用完失效

2.2.4.1.第一輪-Forward Strand

  • 加入primer到靠近P5端(現(xiàn)在P5端在上面)的primer binding

site1上

  • 加入熒光堿基

  • 該堿基的接有熒光基團胁后,用于發(fā)光并抑制鏈增長

  • 拍照

  • 減去熒光基團并洗脫(或店读?加入化學試劑淬滅熒光信號并使dNTP 3’ 疊氮基團變成羥基),再次加入熒光堿基攀芯,重復

2.2.4.2 index1檢測

  • P7端index1檢測

洗脫掉第一輪的產(chǎn)物(read product)屯断,然后加入index1 primer與P7端index1互補配對。測完后洗脫產(chǎn)物

  • P5端index2檢測

P5與index2 primer互補配對侣诺,測完后洗脫

https://upload-images.jianshu.io/upload_images/9376801-60822a5811e4fe8e.png?imageMogr2/auto-orient/strip|imageView2/2/w/376

2.2.4.3 第二輪-Reverse Strand

此時為橋式殖演,擴增成雙鏈,變性成單鏈紧武,分別結(jié)合在tile上的P5‘ 和P7。出去Forward Strand敏储。測Reverse Strand之后的流程與第一輪類似阻星。

2.2.5 單末端測序(SE seq)

single-end只將index,Primer binding site以及P7/P5添加到 fragment 的一端已添,另一端直接連上P5/P7妥箕,將片段固定在Flowcell上橋式PCR生成DNA簇,然后單端測序讀取序列

3.幾個名詞

3.1 基因組重測序Genome Re-sequencing

全基因組重測序是對基因組序列已知的個體進行基因組測序更舞,并在個體或群體水平上進行差異性分析的方法畦幢。隨著基因組測序成本的不斷降低,人類疾病的致病突變研究由外顯子區(qū)域擴大到全基因組范圍缆蝉。通過構建不同長度的插入片段文庫和短序列宇葱、雙末端測序相結(jié)合的策略進行高通量測序瘦真,實現(xiàn)在全基因組水平上檢測疾病關聯(lián)的常見、低頻黍瞧、甚至是罕見的突變位點诸尽,以及結(jié)構變異等,具有重大的科研和產(chǎn)業(yè)價值印颤。

3.2 從頭測序 de novo sequencing

de novo測序也稱為從頭測序:其不需要任何現(xiàn)有的序列資料就可以對某個物種進行測序您机,利用生物信息學分析手段對序列進行拼接,組裝年局,從而獲得該物種的基因組圖譜际看。獲得一個物種的全基因組序列是加快對此物種了解的重要捷徑。隨著新一代測序技術的飛速發(fā)展矢否,基因組測序所需的成本和時間較傳統(tǒng)技術都大大降低仲闽,大規(guī)模基因組測序漸入佳境兴喂,基因組學研究也迎來新的發(fā)展契機和革命性突破蔼囊。利用新一代高通量、高效率測序技術以及強大的生物信息分析能力衣迷,可以高效畏鼓、低成本地測定并分析所有生物的基因組序列。

3.3 全外顯子測序whole exon sequencing

外顯子組測序是指利用序列捕獲技術將全基因組外顯子區(qū)域DNA捕捉并富集后進行高通量測序的基因組分析方法壶谒。外顯子測序相對于基因組重測序成本較低云矫,對研究已知基因的SNP、Indel等具有較大的優(yōu)勢汗菜,但無法研究基因組結(jié)構變異如染色體斷裂重組等让禀。

3.4 ChIP-Seq

染色質(zhì)免疫共沉淀技術(ChromatinImmunoprecipitation,ChIP)也稱結(jié)合位點分析法陨界,是研究體內(nèi)蛋白質(zhì)與DNA相互作用的有力工具巡揍,通常用于轉(zhuǎn)錄因子結(jié)合位點或組蛋白特異性修飾位點的研究。將ChIP與第二代測序技術相結(jié)合的ChIP-Seq技術菌瘪,能夠高效地在全基因組范圍內(nèi)檢測與組蛋白腮敌、轉(zhuǎn)錄因子等互作的DNA區(qū)段。ChIP-Seq的原理是:首先通過染色質(zhì)免疫共沉淀技術(ChIP)特異性地富集目的蛋白結(jié)合的DNA片段俏扩,并對其進行純化與文庫構建糜工;然后對富集得到的DNA片段進行高通量測序。研究人員通過將獲得的數(shù)百萬條序列標簽精確定位到基因組上录淡,從而獲得全基因組范圍內(nèi)與組蛋白捌木、轉(zhuǎn)錄因子等互作的DNA區(qū)段信息。

3.5 SNP和SNV

單核苷酸多態(tài)性singlenucleotide polymorphism嫉戚,SNP 或單核苷酸位點變異SNV刨裆。個體間基因組DNA序列同一位置單個核苷酸變異(替代澈圈、插入或缺失)所引起的多態(tài)性。不同物種崔拥、個體基因組DNA序列同一位置上的單個核苷酸存在差別的現(xiàn)象极舔。有這種差別的基因座、DNA序列等可作為基因組作圖的標志链瓦。人基因組上平均約每1000個核苷酸即可能出現(xiàn)1個單核苷酸多態(tài)性的變化拆魏,其中有些單核苷酸多態(tài)性可能與疾病有關,但可能大多數(shù)與疾病無關慈俯。單核苷酸多態(tài)性是研究人類家族和動植物品系遺傳變異的重要依據(jù)渤刃。在研究癌癥基因組變異時,相對于正常組織贴膘,癌癥中特異的單核苷酸變異是一種體細胞突變(somatic mutation)卖子,稱做SNV。

3.6 測序深度和覆蓋度

測序深度是指測序得到的總堿基數(shù)與待測基因組大小的比值刑峡。假設一個基因大小為2M洋闽,測序深度為10X,那么獲得的總數(shù)據(jù)量為20M突梦。覆蓋度是指測序獲得的序列占整個基因組的比例诫舅。由于基因組中的高GC、重復序列等復雜結(jié)構的存在宫患,測序最終拼接組裝獲得的序列往往無法覆蓋有所的區(qū)域刊懈,這部分沒有獲得的區(qū)域就稱為Gap。例如一個細菌基因組測序娃闲,覆蓋度是98%虚汛,那么還有2%的序列區(qū)域是沒有通過測序獲得的。

3.7 關于readsCount皇帮、RPKM/FPKM卷哩、RPM、TPM的理解

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末属拾,一起剝皮案震驚了整個濱河市将谊,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌捌年,老刑警劉巖瓢娜,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件挂洛,死亡現(xiàn)場離奇詭異礼预,居然都是意外死亡,警方通過查閱死者的電腦和手機虏劲,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進店門托酸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來褒颈,“玉大人,你說我怎么就攤上這事励堡」韧瑁” “怎么了?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵应结,是天一觀的道長刨疼。 經(jīng)常有香客問我,道長鹅龄,這世上最難降的妖魔是什么揩慕? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮扮休,結(jié)果婚禮上迎卤,老公的妹妹穿的比我還像新娘。我一直安慰自己玷坠,他們只是感情好蜗搔,可當我...
    茶點故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著八堡,像睡著了一般樟凄。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上秕重,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天不同,我揣著相機與錄音,去河邊找鬼溶耘。 笑死二拐,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的凳兵。 我是一名探鬼主播百新,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼庐扫!你這毒婦竟也來了饭望?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤形庭,失蹤者是張志新(化名)和其女友劉穎铅辞,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體萨醒,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡斟珊,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了富纸。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片囤踩。...
    茶點故事閱讀 39,779評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡旨椒,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出堵漱,到底是詐尸還是另有隱情综慎,我是刑警寧澤,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布勤庐,位于F島的核電站示惊,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏愉镰。R本人自食惡果不足惜涝涤,卻給世界環(huán)境...
    茶點故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望岛杀。 院中可真熱鬧阔拳,春花似錦、人聲如沸类嗤。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽遗锣。三九已至货裹,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間精偿,已是汗流浹背弧圆。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留笔咽,地道東北人搔预。 一個月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像叶组,于是被迫代替她去往敵國和親拯田。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內(nèi)容