Day7--測序基礎知識

[TOC]

文中1、2自劉小澤處學習拂玻，http://www.reibang.com/p/101c14c3a1d2
學習自相見很不晚http://www.reibang.com/p/0ae1dc30bb04

1.Sanger測序

每次測一條，溶液中他的復制本很多，將溶液分成四份蚤霞，

加入原料：

原材料	功能	備注
ddNTP（放射性標記）	鏈終止，并指示堿基類型	4種ddNTP到4份溶液
dNTP	鏈增長	4份一樣
primer	鏈增長	4份一樣
DNA polymerase	鏈增長	4份一樣

由于復制本大洒擦，成千上萬亚隅，而ddNTP 與DNA單鏈的結(jié)合是隨機的，因此會產(chǎn)生長度不一致的復制半成品

電泳區(qū)分長度
熒光標記指示堿基類型

優(yōu)點：

精度高：99.999%

讀長長：1000bp

缺點：

酶活性不能一直保持倍奢，因此1000bp之后測序準確率就會急速下降朴上。

一次只能測一條鏈，無法高通量

成本高

2.NGS

第二代測序（NGS）技術卒煞，主要學習基于Illumina的邊合成邊測序（Sequence by Synthesis, SBS)技術

2.1 反應裝置

從大到小痪宰，層級劃分

flowcell：NGS測序反應的基本容器
lane*8：測序反應的平行泳道，試劑添加畔裕、洗脫的發(fā)生未知
swath*2：衣撬？
tile*60：cluster generation的場所，每次熒光掃描的位置扮饶，肉眼不可見

2.2 SBS反應過程

2.2.1 將DNA隨機打斷成DNA片段（fragment）

或者叫構建DNA文庫淮韭。

DNA molecules =超聲波==>300-500bp fragments
酶補平為平末端
3‘端加一個A堿基（方便adapter接上，他的3’端有一個T堿基）
兩端加上互補配對的adapter
- 其實還有其他的贴届，Primer binding site靠粪，index（barcode）等
P7和P5末端---（注意：tile上為P7和P5‘蜡吧，因此只有P5端能結(jié)合到tile）

5'端-P5-index2-Adapter-引物結(jié)合位點1-
-fragment-
-引物結(jié)合位點2-Adapter-index1-P7-3'端

PCR擴增
單鏈DNA文庫

2.2.2 將DNA fragment加到flowcell上

將文庫的待測序列實現(xiàn)配好一定濃度，經(jīng)過lane的時候占键，會在特異的化學試劑作用下昔善，強力隨機附著在lane上（tile上）。

2.2.3 Cluster generation

通過橋式PCR進行簇生成畔乙，測序使用的是tile上P7生成的鏈

擴增模板：只有待測序列的P5 端結(jié)合到tile上
- tile上的P5’ 鏈增長君仆，成雙鏈
img
去雜：NaOH強堿溶液變性，洗脫掉待測序列牲距，留下P5‘ 鏈
橋式形成：加入緩沖液返咱，P5' 鏈的P7’ 端與tile上的P7結(jié)合，成橋牍鞠，復制成雙鏈咖摹！

img
PCR，每個fragment會在一定區(qū)域內(nèi)成簇
強堿解鏈难述，甲酰胺基嘧啶糖苷酶（Fpg）選擇性的切掉lane 上p5‘ 連接的鏈萤晴，只留下了與lane p7連接的鏈即Forward Strand

img

2.2.4 雙末端測序(PE seq)

一次加入一個熒光堿基，用完失效

2.2.4.1.第一輪-Forward Strand

加入primer到靠近P5端（現(xiàn)在P5端在上面）的primer binding

site1上

加入熒光堿基
該堿基的接有熒光基團胁后，用于發(fā)光并抑制鏈增長
拍照
減去熒光基團并洗脫（或店读？加入化學試劑淬滅熒光信號并使dNTP 3’ 疊氮基團變成羥基），再次加入熒光堿基攀芯，重復

2.2.4.2 index1檢測

P7端index1檢測

洗脫掉第一輪的產(chǎn)物（read product）屯断，然后加入index1 primer與P7端index1互補配對。測完后洗脫產(chǎn)物

P5端index2檢測

P5與index2 primer互補配對侣诺，測完后洗脫

https://upload-images.jianshu.io/upload_images/9376801-60822a5811e4fe8e.png?imageMogr2/auto-orient/strip|imageView2/2/w/376

2.2.4.3 第二輪-Reverse Strand

此時為橋式殖演，擴增成雙鏈，變性成單鏈紧武，分別結(jié)合在tile上的P5‘ 和P7。出去Forward Strand敏储。測Reverse Strand之后的流程與第一輪類似阻星。

2.2.5 單末端測序(SE seq)

single-end只將index，Primer binding site以及P7/P5添加到 fragment 的一端已添，另一端直接連上P5/P7妥箕，將片段固定在Flowcell上橋式PCR生成DNA簇，然后單端測序讀取序列

3.幾個名詞

3.1 基因組重測序Genome Re-sequencing

全基因組重測序是對基因組序列已知的個體進行基因組測序更舞，并在個體或群體水平上進行差異性分析的方法畦幢。隨著基因組測序成本的不斷降低，人類疾病的致病突變研究由外顯子區(qū)域擴大到全基因組范圍缆蝉。通過構建不同長度的插入片段文庫和短序列宇葱、雙末端測序相結(jié)合的策略進行高通量測序瘦真，實現(xiàn)在全基因組水平上檢測疾病關聯(lián)的常見、低頻黍瞧、甚至是罕見的突變位點诸尽，以及結(jié)構變異等，具有重大的科研和產(chǎn)業(yè)價值印颤。

3.2 從頭測序 de novo sequencing

de novo測序也稱為從頭測序：其不需要任何現(xiàn)有的序列資料就可以對某個物種進行測序您机，利用生物信息學分析手段對序列進行拼接，組裝年局，從而獲得該物種的基因組圖譜际看。獲得一個物種的全基因組序列是加快對此物種了解的重要捷徑。隨著新一代測序技術的飛速發(fā)展矢否，基因組測序所需的成本和時間較傳統(tǒng)技術都大大降低仲闽，大規(guī)模基因組測序漸入佳境兴喂，基因組學研究也迎來新的發(fā)展契機和革命性突破蔼囊。利用新一代高通量、高效率測序技術以及強大的生物信息分析能力衣迷，可以高效畏鼓、低成本地測定并分析所有生物的基因組序列。

3.3 全外顯子測序whole exon sequencing

外顯子組測序是指利用序列捕獲技術將全基因組外顯子區(qū)域DNA捕捉并富集后進行高通量測序的基因組分析方法壶谒。外顯子測序相對于基因組重測序成本較低云矫，對研究已知基因的SNP、Indel等具有較大的優(yōu)勢汗菜，但無法研究基因組結(jié)構變異如染色體斷裂重組等让禀。

3.4 ChIP-Seq

染色質(zhì)免疫共沉淀技術（ChromatinImmunoprecipitation，ChIP）也稱結(jié)合位點分析法陨界，是研究體內(nèi)蛋白質(zhì)與DNA相互作用的有力工具巡揍，通常用于轉(zhuǎn)錄因子結(jié)合位點或組蛋白特異性修飾位點的研究。將ChIP與第二代測序技術相結(jié)合的ChIP-Seq技術菌瘪，能夠高效地在全基因組范圍內(nèi)檢測與組蛋白腮敌、轉(zhuǎn)錄因子等互作的DNA區(qū)段。ChIP-Seq的原理是：首先通過染色質(zhì)免疫共沉淀技術（ChIP）特異性地富集目的蛋白結(jié)合的DNA片段俏扩，并對其進行純化與文庫構建糜工；然后對富集得到的DNA片段進行高通量測序。研究人員通過將獲得的數(shù)百萬條序列標簽精確定位到基因組上录淡，從而獲得全基因組范圍內(nèi)與組蛋白捌木、轉(zhuǎn)錄因子等互作的DNA區(qū)段信息。

3.5 SNP和SNV

單核苷酸多態(tài)性singlenucleotide polymorphism嫉戚，SNP 或單核苷酸位點變異SNV刨裆。個體間基因組DNA序列同一位置單個核苷酸變異(替代澈圈、插入或缺失)所引起的多態(tài)性。不同物種崔拥、個體基因組DNA序列同一位置上的單個核苷酸存在差別的現(xiàn)象极舔。有這種差別的基因座、DNA序列等可作為基因組作圖的標志链瓦。人基因組上平均約每1000個核苷酸即可能出現(xiàn)1個單核苷酸多態(tài)性的變化拆魏，其中有些單核苷酸多態(tài)性可能與疾病有關，但可能大多數(shù)與疾病無關慈俯。單核苷酸多態(tài)性是研究人類家族和動植物品系遺傳變異的重要依據(jù)渤刃。在研究癌癥基因組變異時，相對于正常組織贴膘，癌癥中特異的單核苷酸變異是一種體細胞突變（somatic mutation）卖子，稱做SNV。

3.6 測序深度和覆蓋度

測序深度是指測序得到的總堿基數(shù)與待測基因組大小的比值刑峡。假設一個基因大小為2M洋闽，測序深度為10X，那么獲得的總數(shù)據(jù)量為20M突梦。覆蓋度是指測序獲得的序列占整個基因組的比例诫舅。由于基因組中的高GC、重復序列等復雜結(jié)構的存在宫患，測序最終拼接組裝獲得的序列往往無法覆蓋有所的區(qū)域刊懈，這部分沒有獲得的區(qū)域就稱為Gap。例如一個細菌基因組測序娃闲，覆蓋度是98%虚汛，那么還有2%的序列區(qū)域是沒有通過測序獲得的。

3.7 關于readsCount皇帮、RPKM/FPKM卷哩、RPM、TPM的理解

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末属拾，一起剝皮案震驚了整個濱河市将谊，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌捌年，老刑警劉巖瓢娜，帶你破解...
沈念sama閱讀 217,185評論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件挂洛，死亡現(xiàn)場離奇詭異礼预，居然都是意外死亡，警方通過查閱死者的電腦和手機虏劲，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,652評論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門托酸，熙熙樓的掌柜王于貴愁眉苦臉地迎上來褒颈，“玉大人，你說我怎么就攤上這事励堡」韧瑁” “怎么了？”我有些...
開封第一講書人閱讀 163,524評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵应结，是天一觀的道長刨疼。經(jīng)常有香客問我，道長鹅龄，這世上最難降的妖魔是什么揩慕？我笑而不...
開封第一講書人閱讀 58,339評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮扮休，結(jié)果婚禮上迎卤，老公的妹妹穿的比我還像新娘。我一直安慰自己玷坠，他們只是感情好蜗搔，可當我...
茶點故事閱讀 67,387評論 6贊 391
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著八堡，像睡著了一般樟凄。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上秕重，一...
開封第一講書人閱讀 51,287評論 1贊 301
城市分裂傳說
那天不同，我揣著相機與錄音，去河邊找鬼溶耘。笑死二拐，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的凳兵。我是一名探鬼主播百新，決...
沈念sama閱讀 40,130評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼庐扫！你這毒婦竟也來了饭望？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,985評論 0贊 275
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤形庭，失蹤者是張志新（化名）和其女友劉穎铅辞，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體萨醒，經(jīng)...
沈念sama閱讀 45,420評論 1贊 313
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡斟珊，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,617評論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了富纸。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片囤踩。...
茶點故事閱讀 39,779評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡旨椒，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出堵漱，到底是詐尸還是另有隱情综慎，我是刑警寧澤，帶...
沈念sama閱讀 35,477評論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布勤庐，位于F島的核電站示惊，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏愉镰。R本人自食惡果不足惜涝涤，卻給世界環(huán)境...
茶點故事閱讀 41,088評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望岛杀。院中可真熱鬧阔拳，春花似錦、人聲如沸类嗤。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,716評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽遗锣。三九已至货裹，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間精偿，已是汗流浹背弧圆。一陣腳步聲響...
開封第一講書人閱讀 32,857評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留笔咽，地道東北人搔预。一個月前我還...
沈念sama閱讀 47,876評論 2贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像叶组，于是被迫代替她去往敵國和親拯田。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 44,700評論 2贊 354