原理:基于不同建立經(jīng)過納米孔時孕讳,電流信號的差異
典型應(yīng)用:
- 讀長比較長匠楚,利于拼接
- 解決動植物多倍體高重復(fù)、高雜合的特性
- 也適用于細菌拼接
- 對RNA直接測序厂财,無需反轉(zhuǎn)錄芋簿,直接識別RNA的堿基修飾
- 適合檢測大片段結(jié)構(gòu)變異
- 測序長度越長對定相分析越有利
測序設(shè)備
設(shè)備名稱 | 特點 |
---|---|
minION | 入門選擇,手持式璃饱,數(shù)據(jù)量30Gb |
GridION | 相當(dāng)于5張芯片外加一臺服務(wù)器 |
PromethION | 24或48個測序芯片与斤,數(shù)據(jù)量達到Tb級別 |
MinION Mk1C | 可連接藍牙或者Sim卡 |
Flongle | MinION和GridION的轉(zhuǎn)換器 |
MinIT | 預(yù)裝Linux系統(tǒng) |
VolTRAX | 自動化文庫制備 |
建庫測序
對待測DNA的一些處理,是一個模板過程。
- DNA提取
評估核酸質(zhì)量和完整性
可以使用Nanodrop儀器進行檢驗撩穿。
DNA :A260/A280 = ~1.8 磷支,A260/A230=~2.0-2.2
RNA : A260/A280 = ~2.0 ,A260/A230=~2.0-2.2
評估片段大小
使用Agilent Bioanalyzer/Tapestation食寡,PFGE雾狈,fragment analyzer,F(xiàn)EMTO pulse
nanopore建庫
建庫圖
給待測DNA兩側(cè)先加上A堿基抵皱,使平末端變成粘性末端善榛,然后再加上Y接頭以及馬達蛋白。
測序錯誤
堿基識別的非準確性呻畸,每秒讀數(shù)也不恒定移盆。信號讀取的頻率無法做到一個堿基讀一個,而是多個堿基一起讀一個信號伤为,相當(dāng)于一個分類器咒循。
nanopore測序文件可以生成fast5文件和fastq文件
fast5文件: 大而全,耗存儲大钮呀,適合做堿基校正和表觀遺傳學(xué)分析剑鞍。記錄著設(shè)備運行時全部的信息,包括捕獲的電信號值爽醋,設(shè)備運行時間蚁署,電壓,溫度等等信息蚂四。
- 可以使用HDFView 查看Fast5文件格式光戈。https://www.hdfgroup.org/downloads/hdfview/
- 可以使用ont_fast5_api軟件對fast5文件進行拆分與合并
fastq文件:常用,廠商一般給的遂赠,包含堿基和堿基質(zhì)量
流程
Basecalling:將原始測序文件轉(zhuǎn)換為堿基序列的過程
久妆,如guppy工具主要包括三大功能:
1、堿基識別
這是它的主要功能跷睦,Guppy使用神經(jīng)網(wǎng)絡(luò)算法(RNN)將電信號數(shù)據(jù)解讀為DNA或RNA的五個標準堿基筷弦,即腺嘌呤,鳥嘌呤抑诸,胞咳淀烂琴,胸腺咳淀和尿密淀。
2蜕乡、拆分條碼數(shù)據(jù)
如果建庫時添加了barcode條形碼奸绷,那么在序列開端和尾端均有Oxford Nanopore Technologies提供的條形碼序列,Guppy數(shù)據(jù)拆分功能基于識別出的堿基序列层玲。這個原理類似于illumina basecalling中的index拆分号醉。
3反症、比對
將測序數(shù)據(jù)與參考序列進行比對,其實這個是調(diào)用minimap2做的畔派,而且選項參數(shù)都是內(nèi)置的铅碍,無法調(diào)整,所以父虑,這個功能還是不要使用了该酗,一個軟件還是把自己該做的事情做好。
4士嚎、甲基化修飾位點檢測
如果某個堿基發(fā)生了甲基化修飾呜魄,那么在堿基識別過程中就會表現(xiàn)出一些異常信息,這些離群信息有可能就是潛在的甲基化修飾位點莱衩,guppy目前也可以進行堿基修飾的檢測爵嗅,不過這個需要學(xué)習(xí)集,不同物種需要單獨的學(xué)習(xí)集笨蚁,目前只試驗了大腸桿菌睹晒,人等模式生物,如果有需要可以嘗試進行檢測括细。
下載和安裝參考官網(wǎng)
使用minion_qc來進行統(tǒng)計繪圖
常用軟件
以上內(nèi)容整理至知乎https://zhuanlan.zhihu.com/p/102392867
原作者 公眾號 基因?qū)W苑