「BioNano系列」光學(xué)圖譜混合組裝應(yīng)該怎么做一死?

評估從頭組裝結(jié)果

Bionano從頭組裝出光學(xué)圖譜CMAP可以和參考序列的CMAP進行比對,通過Access上可視化檢查參考基因組的組裝質(zhì)量傻唾,比較兩者間的不同投慈。

這里所用的CMAP圖譜來自于一篇發(fā)表在NC的擬南芥的基因組文章(原本計劃用他們的bnx文件介紹從頭組裝承耿,但是通訊作者根本不搭理我),

光學(xué)圖譜的下載方式為:

wget https://submit.ncbi.nlm.nih.gov/ft/byid/w4jcevedkbs-mac-74_bng_contigs2017.cmap

我們可以根據(jù)「三代組裝」使用minimap+miniasm對nanopore進行基因組組裝組裝出對應(yīng)的物理圖譜伪煤,

分析代碼如下:

#模擬酶切
perl /opt/biosoft/Solve3.3_10252018/Pipeline/10252018/fa2cmap_multi_color.pl -i R05C0144.fa -e BspQI 1
# 兩個圖譜比較
python /opt/biosoft/Solve3.3_10252018/Pipeline/10252018/runCharacterize.py \
    -t /opt/biosoft/Solve3.3_10252018/RefAligner/7915.7989rel/RefAligner \
    -q kbs-mac-74_bng_contigs2017.cmap -r R05C0144_BSPQI_0kb_0labels.cmap \
    -p /opt/biosoft/Solve3.3_10252018/Pipeline/10252018 \
    -a /opt/biosoft/Solve3.3_10252018/RefAligner/7915.7989rel/optArguments_nonhaplotype_noES_irys.xml \
    -n 10

運行之后會在當(dāng)前目錄下生成一個"alignref"文件夾加袋, 將其中的"q.cmap","r.cmap",".xmap"下載到本地,上傳到access中進行可視化

組裝肉眼評估

上圖中抱既,箭頭指示的部分可能就是光學(xué)圖譜能用于錨定其他contig的部分职烧,這就是下一節(jié)光學(xué)圖譜輔助組裝的原理。

光學(xué)圖譜輔助組裝

NGM(Next-Generation Mapping) Scaffold 流程:

  1. 為序列數(shù)據(jù)產(chǎn)生 in silico 圖譜
  2. 將序列和Bionano基因組圖譜進行比較防泵,找到兩者之間的沖突并嘗試解決
  3. 將不沖突的圖譜合并成 hybrid scafold
  4. 在序列圖譜和hybrid scaffold之間形成聯(lián)配
  5. 得到scaffold的AGP和FASTA文件

整個流程和Bionano Access完美整合蚀之,為使用者提供了方便的操作界面,用于對scafflod結(jié)果進行可視化捷泞。流程的腳本在"/opt/biosoft/Solve3.3_10252018/HybridScaffold/10252018"

單酶系統(tǒng)

流程控制腳本為: Solve3.3_版本日期HybridScaffold/版本日期/hybridScaffold.pl, 他接受輸入文件足删,輸出運行過程中的信息,產(chǎn)生輸出文件锁右,最后得到結(jié)果描述失受。

有四個必須文件: FASTA格式組裝結(jié)果,CMAP格式的Bionano 基因組圖譜組裝咏瑟,XML格式的配置文件拂到, RefAligner.

perl hybridScaffold.pl 
    -n FASTA格式序列 (必須)
    -b BIonano CMAP文件 (必須)
    -c  Merge 的XML配置文件 (必須)
    -r RefAligner運行工具路徑 (必須)
    -o 輸出文件夾 (必須)
    -B conflict filter level genome maps; 1,2 or3, 決定如何處理沖突响蕴,1表示不過濾谆焊,2表示在沖突處分割contig,3表示刪除沖突的contig浦夷,沒有-M時一定要加入
    -N conflict filter level for sequences; 1,2 or 3辖试, 決定如何處理沖突,1表示不過濾劈狐,2表示在沖突處分割contig罐孝,3表示刪除沖突的contig,沒有-M時一定要加入
    -f 是否覆蓋之前的輸出
    -x 分別進行hybrid scaffold 和 genome map的相互比對
    -y 為輸入的genome maps生成嵌合質(zhì)量分
    -M 輸入手工解決過沖突的文件
    -m: 如果使用了-x或-y參數(shù)肥缔,則需要輸入Bionano molecules的BNX文件
    -p 從頭組裝流程的文件路徑莲兢,如果使用了-x或, -y 選項,就需要加入這一項
    -q 從頭組裝流程的XML配置文件续膳,如果使用了-x或, -y 選項改艇,就需要加入這一項
    -e 從頭組裝時的噪音參數(shù), .errbin或err文件
    -v 輸出流程版本信息

明確一點: -c 要求的XML文件真的不是無腦用坟岔,需要修改其中fasta2cmap的enzyme部分

實際運行案例:

cp /opt/biosoft/Solve3.3_10252018/HybridScaffold/10252018/hybridScaffold_config.xml .
# 用vim修改hybridScaffold_config.xml中的enzyme
perl /opt/biosoft/Solve3.3_10252018/HybridScaffold/10252018/hybridScaffold.pl \
    -n R05C0144.fa \
    -b kbs-mac-74_bng_contigs2017.cmap \
    -c hybridScaffold_config.xml \
    -r /opt/biosoft/Solve3.3_10252018/RefAligner/7915.7989rel/RefAligner \
    -o R05C0144 \
    -B 2 -N 2 \
    -f 

運行過程中會輸出scaffold N50等一些參數(shù)谒兄。N50僅僅提升了1.1M,估計是作者bionano數(shù)據(jù)不夠多社付。

組裝的FASTA在"R05C0144/agp_fasta"文件下承疲,而"R05C0144/hybridScaffold_archive.tar.gz"可以上傳到Access查看組裝效果, 下圖就是一個典型的混合組裝

典型的混合組裝結(jié)果

當(dāng)然具體分為哪幾步邻耕,以及每一步調(diào)用的腳本如下所示:

第一步: 將FASTA轉(zhuǎn)成CMAP格式,

Step 1

用到一個perl腳本, fa2cmap_multi_color.pl, 通過對基因組序列進行模式搜索尋找可能的酶切位點,默認輸出在"fa2cmap"文件夾下

第二步: 識別并解決沖突燕鸽。

Step 2

沖突可能來自于真實的等位基因兄世,或者時組裝錯誤,最終的結(jié)果就是在聯(lián)配中出現(xiàn)過多無法比對上的標(biāo)記(labels). Hybrid Scaffold流程會先用RefAligner將第一步得到的cmp去跟Bionano基因組圖譜比啊研,然后用AssignAlignType.pl識別沖突交界處御滩。輸入文件為RefAligner運行后得到的XMAP和CMAP文件,以及原始序列和原始Bionano基因組圖譜悲伶。統(tǒng)計每個聯(lián)配中比對和未必對標(biāo)記數(shù)艾恼,根據(jù)XML配置文件中"assignAlignType.max_overhang" 參數(shù)設(shè)置最大可以容忍的無法聯(lián)配的標(biāo)記數(shù)。最后會輸出"assginAlignType.xmap"(列出沖突位置),以及"assignAlignType_r.cmap"(無沖突序列), "assignAlignType_q.cmap"(無沖突圖譜)麸锉。更重要的是"conflicts.txt"钠绍,記錄著每個可能的位置。

之后流程用cut_conflicts.pl解決不一致的位置花沉, 輸出"conflicts_cut_status.txt", 可以手工編輯柳爽,有監(jiān)督的進行處理。

第三步: 合并兩者的組裝結(jié)果碱屁,形成Hybrid scaffold

Step 3

這一步用MergeNGS_BN.pl腳本完成磷脯,它會調(diào)用RefAligner進行迭代兩兩配對合并,輸入文件是下面的其中一個

  • 原始輸入
  • 沖突解決后的組裝(cut_conflicts.pl輸出結(jié)果)
  • 沒有沖突的組裝(AssignAlignType.pl的結(jié)果)

每一種輸入都是一種選項娩脾,我們可以嘗試不同的輸入赵誓,最后進行比較。

第四步: 將序列圖圖譜和基因組圖譜比對到hybrid scaffold

Step 4

第五步: 生成hybrid scaffold表征的AGP和FASTA文件

Step 5

一些注意事項:

  • Bionano很難處理Hi-C數(shù)據(jù)引起的基因組中朝向/排序的錯誤柿赊。所以先Bionano混合組裝俩功,然后才是Hi-C
  • 覆蓋度: 至少50X,NLRS隨著覆蓋度提高并不會有明顯增強圖譜連續(xù)性碰声,DLS(例如DLE0-1) 100X以上的覆蓋度能夠明顯提高某些植物和東西的圖譜連續(xù)性诡蜓。
  • 當(dāng)前的Hybrid Scaffold 流程無法很好處理單倍體信息,所以上一步的從頭組裝一定要是nonhaplotype.
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末胰挑,一起剝皮案震驚了整個濱河市蔓罚,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌瞻颂,老刑警劉巖豺谈,帶你破解...
    沈念sama閱讀 217,657評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異贡这,居然都是意外死亡茬末,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評論 3 394
  • 文/潘曉璐 我一進店門藕坯,熙熙樓的掌柜王于貴愁眉苦臉地迎上來团南,“玉大人,你說我怎么就攤上這事炼彪⊥赂” “怎么了?”我有些...
    開封第一講書人閱讀 164,057評論 0 354
  • 文/不壞的土叔 我叫張陵辐马,是天一觀的道長拷橘。 經(jīng)常有香客問我,道長喜爷,這世上最難降的妖魔是什么冗疮? 我笑而不...
    開封第一講書人閱讀 58,509評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮檩帐,結(jié)果婚禮上术幔,老公的妹妹穿的比我還像新娘。我一直安慰自己湃密,他們只是感情好诅挑,可當(dāng)我...
    茶點故事閱讀 67,562評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著泛源,像睡著了一般拔妥。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上达箍,一...
    開封第一講書人閱讀 51,443評論 1 302
  • 那天没龙,我揣著相機與錄音,去河邊找鬼缎玫。 笑死硬纤,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的碘梢。 我是一名探鬼主播咬摇,決...
    沈念sama閱讀 40,251評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼煞躬!你這毒婦竟也來了肛鹏?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,129評論 0 276
  • 序言:老撾萬榮一對情侶失蹤恩沛,失蹤者是張志新(化名)和其女友劉穎在扰,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體雷客,經(jīng)...
    沈念sama閱讀 45,561評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡芒珠,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,779評論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了搅裙。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片皱卓。...
    茶點故事閱讀 39,902評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡裹芝,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出娜汁,到底是詐尸還是另有隱情嫂易,我是刑警寧澤,帶...
    沈念sama閱讀 35,621評論 5 345
  • 正文 年R本政府宣布掐禁,位于F島的核電站怜械,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏傅事。R本人自食惡果不足惜缕允,卻給世界環(huán)境...
    茶點故事閱讀 41,220評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蹭越。 院中可真熱鬧障本,春花似錦、人聲如沸响鹃。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,838評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽茴迁。三九已至寄悯,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間堕义,已是汗流浹背猜旬。 一陣腳步聲響...
    開封第一講書人閱讀 32,971評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留倦卖,地道東北人洒擦。 一個月前我還...
    沈念sama閱讀 48,025評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像怕膛,于是被迫代替她去往敵國和親熟嫩。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,843評論 2 354

推薦閱讀更多精彩內(nèi)容