測(cè)序原理及測(cè)序平臺(tái)簡(jiǎn)介
了解測(cè)序平臺(tái)原理對(duì)于理解測(cè)序結(jié)果很有幫助,如果有機(jī)會(huì)參加測(cè)序儀公司的培訓(xùn)戏蔑,最好參加下蹋凝,有助于理解測(cè)序原理,他們準(zhǔn)備的ppt內(nèi)容還是挺豐富的总棵,包括一代鳍寂、二代、三代測(cè)序原理的基本介紹情龄,同時(shí)一般也會(huì)介紹最前沿的測(cè)序技術(shù)以及各自的優(yōu)缺點(diǎn)迄汛。當(dāng)然,這些知識(shí)點(diǎn)網(wǎng)上已經(jīng)有很多介紹骤视,不再做無(wú)用功鞍爱。把時(shí)間用在最需要的地方。
測(cè)序平臺(tái)介紹可以參考以下兩個(gè)帖子尚胞,其實(shí)需要了解的內(nèi)容就是知道都有哪些測(cè)序平臺(tái)硬霍。下面兩個(gè)帖子介紹的很詳細(xì)。
2016 NGS Field Guide: Overview
簡(jiǎn)單粗暴的講解所謂的一代笼裳,二代唯卖,三代測(cè)序技術(shù)
第一代測(cè)序技術(shù):Sanger末端終止法: 指雙脫氧末端終止法粱玲,擴(kuò)增后通過(guò)毛細(xì)管電泳讀取序列,每次獲取數(shù)據(jù)量少
第二代測(cè)序技術(shù):邊合成邊測(cè)序:高通量測(cè)序拜轨,采用微珠或高密度芯片邊合成邊測(cè)序抽减,代表有454,solexa橄碾,solid卵沉,高通量,可一次獲得數(shù)G數(shù)據(jù)法牲,相對(duì)與第三代史汗,都仍然需要擴(kuò)增的方法放大信號(hào),擴(kuò)增后再檢測(cè)拒垃。
第三大測(cè)序技術(shù)分為兩大陣營(yíng):第一大陣營(yíng)是單分子熒光測(cè)序停撞,代表性的技術(shù)為美國(guó)螺旋生物(Helicos)的SMS技術(shù)和美國(guó)太平洋生物(Pacific Bioscience)的SMRT技術(shù)。第二大陣營(yíng)為納米孔測(cè)序悼瓮,代表性的公司為英國(guó)牛津納米孔公司戈毒。
第三代特點(diǎn)是單分子測(cè)序,多基于納米科技横堡,無(wú)需擴(kuò)增埋市,對(duì)單分鏈DNA/RNA直接用合成、降解命贴、通過(guò)納米孔等方式直接測(cè)序道宅,核心特點(diǎn)是無(wú)需擴(kuò)增所以成本更低。
二代套么,三代或者四代測(cè)序儀的優(yōu)缺點(diǎn)是什么
總的來(lái)說(shuō)培己,二代測(cè)序讀長(zhǎng)段,需要更多的后續(xù)軟件分析來(lái)對(duì)結(jié)果進(jìn)行解讀胚泌,而且二代測(cè)序結(jié)果分析軟件和流程最成熟,但是二代測(cè)序可以做基因表達(dá)定量肃弟。三代測(cè)序的優(yōu)點(diǎn)是讀長(zhǎng)長(zhǎng)玷室,所以覆蓋度較好,更適合做基因組測(cè)序或者做SNP笤受、基因融合之類的檢測(cè)穷缤,三代測(cè)序目前最大的缺點(diǎn)是分析流程及分析軟件還不多。
可以參考以下帖子:
一代測(cè)序箩兽、二代測(cè)序以及三代測(cè)序的優(yōu)缺點(diǎn)及應(yīng)用對(duì)比
相比于二代測(cè)序津肛,三代測(cè)序具有如下優(yōu)勢(shì):
- 第三代基因測(cè)序讀長(zhǎng)較長(zhǎng),如Pacific Biosciences 公司的 PACBIO RS II 的平均讀長(zhǎng)達(dá)到 10kb汗贫,可以減少生物信息學(xué)中的拼接成本身坐,也節(jié)省了內(nèi)存和計(jì)算時(shí)間秸脱。
- 直接對(duì)原始DNA樣本進(jìn)行測(cè)序,從作用原理上避免了 PCR 擴(kuò)增帶來(lái)的出錯(cuò)部蛇。
- 拓展了測(cè)序技術(shù)的應(yīng)用領(lǐng)域摊唇,二代測(cè)序技術(shù)大部分應(yīng)用基于DNA,三代測(cè)序還有兩個(gè)應(yīng)用是二代測(cè)序所不具備的:第一個(gè)是直接測(cè)RNA的序列涯鲁,RNA的直接測(cè)序巷查,將大大降低體外逆轉(zhuǎn)錄產(chǎn)生的系統(tǒng)誤差。第二個(gè)是直接測(cè)甲基化的DNA序列抹腿。實(shí)際上DNA聚合酶復(fù)制A岛请、T、C警绩、G的速度是不一樣的髓需。正常的C或者甲基化的C為模板廷区,DNA聚合酶停頓的時(shí)間不同伯襟,根據(jù)這個(gè)不同的時(shí)間败砂,可以判斷模板的C是否甲基化管嬉。
- 三代測(cè)序在ctDNA膜蠢,單細(xì)胞測(cè)序中具有很大的優(yōu)勢(shì):ctDNA含量非常低羽利,三代測(cè)序技術(shù)靈敏度高榛做,能夠?qū)τ?ng以下做到監(jiān)測(cè)券勺;在單細(xì)胞級(jí)別:二代測(cè)序要把DNA提取出來(lái)打碎測(cè)序檀蹋,三代測(cè)序直接對(duì)原始DNA測(cè)序松申,細(xì)胞裂解原位測(cè)序,是三代測(cè)序的殺手應(yīng)用俯逾。
第三代基因測(cè)序也存在一定的缺陷:
- 總體上單讀長(zhǎng)的錯(cuò)誤率依然偏高贸桶,成為限制其商業(yè)應(yīng)用開展的重要原因;第三代基因測(cè)序技術(shù)目前的錯(cuò)誤率在15%-40%桌肴,極大地高于二代測(cè)序技術(shù)NGS的錯(cuò)誤率(低于1%)皇筛。不過(guò)好在三代的錯(cuò)誤是完全隨機(jī)發(fā)生的,可以靠覆蓋度來(lái)糾錯(cuò)(但這要增加測(cè)序成本)坠七。
- 三代測(cè)序技術(shù)依賴DNA聚合酶的活性水醋。
- 成本較高,二代Illumina的測(cè)序成本是每100萬(wàn)個(gè)堿基0.05-0.15美元彪置,三代測(cè)序成本是每100萬(wàn)個(gè)堿基0.33-1.00美元拄踪。
- 生信分析軟件也不夠豐富。
FastQC安裝及結(jié)果解讀
FastQC安裝
cd ~/path/you/want/to/install/FastQC
wget http://data.biostarhandbook.com/data/sequencing-platform-data.tar.gz
tar xzvf sequencing-platform-data.tar.gz
FastQC官方視頻簡(jiǎn)介,鏈接:http://pan.baidu.com/s/1i5CJgqh 密碼:w0ga
使用multiQC聚合fastqc的輸出結(jié)果
MultiQC安裝
有以下幾種方法:
# 1. use pip to install or upgrade
pip install multiqc
pip install --upgrade multiqc
# 2. use conda to install
conda install -c bioconda multiqc
# 3. manual install
cd ~/folder/you/want/to/install
git clone https://github.com/ewels/MultiQC.git
python setup.py install
MultiQC使用方法:
multiqc ~/path/to/your/fastQC/results/ --ignore *.html
FASTQ數(shù)據(jù)糾錯(cuò)
測(cè)序錯(cuò)誤是隨機(jī)的拳魁,當(dāng)測(cè)序深度很深的時(shí)候惶桐,可以通過(guò)周圍測(cè)序結(jié)果的一致性來(lái)判斷小部分不一致的情況是否是測(cè)序錯(cuò)誤。
fastq糾錯(cuò)程序會(huì)嘗試糾正或去除有錯(cuò)誤的reads。
BBMap short read aligner中的BBNorm功能可以實(shí)現(xiàn)fastq文件糾錯(cuò)姚糊。官方對(duì)于糾錯(cuò)功能簡(jiǎn)介:
BBMap: Short read aligner for DNA and RNA-seq data. Capable of handling arbitrarily large genomes with millions of scaffolds. Handles Illumina, PacBio, 454, and other reads; very high sensitivity and tolerant of errors and numerous large indels. Very fast.
BBNorm: Kmer-based error-correction and normalization tool.
當(dāng)然贿衍,除了糾錯(cuò)功能以外,還有很多其他功能叛拷,可自行探索舌厨。
文末福利
The following tutorial are good for newbies, hope you will find your way to success.
Next Generation Sequencing Data Analysis
網(wǎng)頁(yè)視頻教程下載鏈接:http://pan.baidu.com/s/1bZHFTO 密碼:q239
版權(quán)屬原作者。