「BioNano系列」光學(xué)圖譜混合組裝應(yīng)該怎么做一死？

評估從頭組裝結(jié)果

Bionano從頭組裝出光學(xué)圖譜CMAP可以和參考序列的CMAP進行比對，通過Access上可視化檢查參考基因組的組裝質(zhì)量傻唾，比較兩者間的不同投慈。

這里所用的CMAP圖譜來自于一篇發(fā)表在NC的擬南芥的基因組文章(原本計劃用他們的bnx文件介紹從頭組裝承耿，但是通訊作者根本不搭理我)，

光學(xué)圖譜的下載方式為:

wget https://submit.ncbi.nlm.nih.gov/ft/byid/w4jcevedkbs-mac-74_bng_contigs2017.cmap

我們可以根據(jù)「三代組裝」使用minimap+miniasm對nanopore進行基因組組裝組裝出對應(yīng)的物理圖譜伪煤，

分析代碼如下:

#模擬酶切
perl /opt/biosoft/Solve3.3_10252018/Pipeline/10252018/fa2cmap_multi_color.pl -i R05C0144.fa -e BspQI 1
# 兩個圖譜比較
python /opt/biosoft/Solve3.3_10252018/Pipeline/10252018/runCharacterize.py \
    -t /opt/biosoft/Solve3.3_10252018/RefAligner/7915.7989rel/RefAligner \
    -q kbs-mac-74_bng_contigs2017.cmap -r R05C0144_BSPQI_0kb_0labels.cmap \
    -p /opt/biosoft/Solve3.3_10252018/Pipeline/10252018 \
    -a /opt/biosoft/Solve3.3_10252018/RefAligner/7915.7989rel/optArguments_nonhaplotype_noES_irys.xml \
    -n 10

運行之后會在當(dāng)前目錄下生成一個"alignref"文件夾加袋，將其中的"q.cmap","r.cmap",".xmap"下載到本地，上傳到access中進行可視化

組裝肉眼評估

上圖中抱既，箭頭指示的部分可能就是光學(xué)圖譜能用于錨定其他contig的部分职烧，這就是下一節(jié)光學(xué)圖譜輔助組裝的原理。

光學(xué)圖譜輔助組裝

NGM(Next-Generation Mapping) Scaffold 流程:

為序列數(shù)據(jù)產(chǎn)生 in silico 圖譜
將序列和Bionano基因組圖譜進行比較防泵，找到兩者之間的沖突并嘗試解決
將不沖突的圖譜合并成 hybrid scafold
在序列圖譜和hybrid scaffold之間形成聯(lián)配
得到scaffold的AGP和FASTA文件

整個流程和Bionano Access完美整合蚀之，為使用者提供了方便的操作界面，用于對scafflod結(jié)果進行可視化捷泞。流程的腳本在"/opt/biosoft/Solve3.3_10252018/HybridScaffold/10252018"

單酶系統(tǒng)

流程控制腳本為: Solve3.3_版本日期HybridScaffold/版本日期/hybridScaffold.pl, 他接受輸入文件足删，輸出運行過程中的信息，產(chǎn)生輸出文件锁右，最后得到結(jié)果描述失受。

有四個必須文件: FASTA格式組裝結(jié)果，CMAP格式的Bionano 基因組圖譜組裝咏瑟，XML格式的配置文件拂到， RefAligner.

perl hybridScaffold.pl 
    -n FASTA格式序列 (必須)
    -b BIonano CMAP文件 (必須)
    -c  Merge 的XML配置文件 (必須)
    -r RefAligner運行工具路徑 (必須)
    -o 輸出文件夾 (必須)
    -B conflict filter level genome maps; 1,2 or3， 決定如何處理沖突响蕴，1表示不過濾谆焊，2表示在沖突處分割contig，3表示刪除沖突的contig浦夷，沒有-M時一定要加入
    -N conflict filter level for sequences; 1,2 or 3辖试， 決定如何處理沖突，1表示不過濾劈狐，2表示在沖突處分割contig罐孝，3表示刪除沖突的contig，沒有-M時一定要加入
    -f 是否覆蓋之前的輸出
    -x 分別進行hybrid scaffold 和 genome map的相互比對
    -y 為輸入的genome maps生成嵌合質(zhì)量分
    -M 輸入手工解決過沖突的文件
    -m: 如果使用了-x或-y參數(shù)肥缔，則需要輸入Bionano molecules的BNX文件
    -p 從頭組裝流程的文件路徑莲兢，如果使用了-x或, -y 選項，就需要加入這一項
    -q 從頭組裝流程的XML配置文件续膳，如果使用了-x或, -y 選項改艇，就需要加入這一項
    -e 從頭組裝時的噪音參數(shù)， .errbin或err文件
    -v 輸出流程版本信息

明確一點: -c 要求的XML文件真的不是無腦用坟岔，需要修改其中fasta2cmap的enzyme部分

實際運行案例:

cp /opt/biosoft/Solve3.3_10252018/HybridScaffold/10252018/hybridScaffold_config.xml .
# 用vim修改hybridScaffold_config.xml中的enzyme
perl /opt/biosoft/Solve3.3_10252018/HybridScaffold/10252018/hybridScaffold.pl \
    -n R05C0144.fa \
    -b kbs-mac-74_bng_contigs2017.cmap \
    -c hybridScaffold_config.xml \
    -r /opt/biosoft/Solve3.3_10252018/RefAligner/7915.7989rel/RefAligner \
    -o R05C0144 \
    -B 2 -N 2 \
    -f

運行過程中會輸出scaffold N50等一些參數(shù)谒兄。N50僅僅提升了1.1M，估計是作者bionano數(shù)據(jù)不夠多社付。

組裝的FASTA在"R05C0144/agp_fasta"文件下承疲，而"R05C0144/hybridScaffold_archive.tar.gz"可以上傳到Access查看組裝效果, 下圖就是一個典型的混合組裝

典型的混合組裝結(jié)果

當(dāng)然具體分為哪幾步邻耕，以及每一步調(diào)用的腳本如下所示:

第一步：將FASTA轉(zhuǎn)成CMAP格式,

Step 1

用到一個perl腳本, fa2cmap_multi_color.pl, 通過對基因組序列進行模式搜索尋找可能的酶切位點，默認輸出在"fa2cmap"文件夾下

第二步: 識別并解決沖突燕鸽。

Step 2

沖突可能來自于真實的等位基因兄世，或者時組裝錯誤，最終的結(jié)果就是在聯(lián)配中出現(xiàn)過多無法比對上的標(biāo)記(labels). Hybrid Scaffold流程會先用RefAligner將第一步得到的cmp去跟Bionano基因組圖譜比啊研，然后用AssignAlignType.pl識別沖突交界處御滩。輸入文件為RefAligner運行后得到的XMAP和CMAP文件，以及原始序列和原始Bionano基因組圖譜悲伶。統(tǒng)計每個聯(lián)配中比對和未必對標(biāo)記數(shù)艾恼，根據(jù)XML配置文件中"assignAlignType.max_overhang" 參數(shù)設(shè)置最大可以容忍的無法聯(lián)配的標(biāo)記數(shù)。最后會輸出"assginAlignType.xmap"(列出沖突位置),以及"assignAlignType_r.cmap"(無沖突序列), "assignAlignType_q.cmap"(無沖突圖譜)麸锉。更重要的是"conflicts.txt"钠绍，記錄著每個可能的位置。

之后流程用cut_conflicts.pl解決不一致的位置花沉，輸出"conflicts_cut_status.txt", 可以手工編輯柳爽，有監(jiān)督的進行處理。

第三步: 合并兩者的組裝結(jié)果碱屁，形成Hybrid scaffold

Step 3

這一步用MergeNGS_BN.pl腳本完成磷脯，它會調(diào)用RefAligner進行迭代兩兩配對合并，輸入文件是下面的其中一個

原始輸入
沖突解決后的組裝(cut_conflicts.pl輸出結(jié)果)
沒有沖突的組裝(AssignAlignType.pl的結(jié)果)

每一種輸入都是一種選項娩脾，我們可以嘗試不同的輸入赵誓，最后進行比較。

第四步: 將序列圖圖譜和基因組圖譜比對到hybrid scaffold

Step 4

第五步: 生成hybrid scaffold表征的AGP和FASTA文件

Step 5

一些注意事項：

Bionano很難處理Hi-C數(shù)據(jù)引起的基因組中朝向/排序的錯誤柿赊。所以先Bionano混合組裝俩功，然后才是Hi-C
覆蓋度: 至少50X，NLRS隨著覆蓋度提高并不會有明顯增強圖譜連續(xù)性碰声，DLS(例如DLE0-1) 100X以上的覆蓋度能夠明顯提高某些植物和東西的圖譜連續(xù)性诡蜓。
當(dāng)前的Hybrid Scaffold 流程無法很好處理單倍體信息，所以上一步的從頭組裝一定要是nonhaplotype.

最后編輯于：2020.06.18 09:08:50

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末胰挑，一起剝皮案震驚了整個濱河市蔓罚，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌瞻颂，老刑警劉巖豺谈，帶你破解...
沈念sama閱讀 217,657評論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異贡这，居然都是意外死亡茬末，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,889評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門藕坯，熙熙樓的掌柜王于貴愁眉苦臉地迎上來团南，“玉大人，你說我怎么就攤上這事炼彪⊥赂” “怎么了？”我有些...
開封第一講書人閱讀 164,057評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵辐马，是天一觀的道長拷橘。經(jīng)常有香客問我，道長喜爷，這世上最難降的妖魔是什么冗疮？我笑而不...
開封第一講書人閱讀 58,509評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮檩帐，結(jié)果婚禮上术幔，老公的妹妹穿的比我還像新娘。我一直安慰自己湃密，他們只是感情好诅挑，可當(dāng)我...
茶點故事閱讀 67,562評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著泛源，像睡著了一般拔妥。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上达箍，一...
開封第一講書人閱讀 51,443評論 1贊 302
城市分裂傳說
那天没龙，我揣著相機與錄音，去河邊找鬼缎玫。笑死硬纤，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的碘梢。我是一名探鬼主播咬摇，決...
沈念sama閱讀 40,251評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼煞躬！你這毒婦竟也來了肛鹏？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,129評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤恩沛，失蹤者是張志新（化名）和其女友劉穎在扰，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體雷客，經(jīng)...
沈念sama閱讀 45,561評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡芒珠，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,779評論 3贊 335
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了搅裙。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片皱卓。...
茶點故事閱讀 39,902評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡裹芝，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出娜汁，到底是詐尸還是另有隱情嫂易，我是刑警寧澤，帶...
沈念sama閱讀 35,621評論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布掐禁，位于F島的核電站怜械，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏傅事。R本人自食惡果不足惜缕允，卻給世界環(huán)境...
茶點故事閱讀 41,220評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望蹭越。院中可真熱鬧障本，春花似錦、人聲如沸响鹃。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,838評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽茴迁。三九已至寄悯，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間堕义，已是汗流浹背猜旬。一陣腳步聲響...
開封第一講書人閱讀 32,971評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留倦卖，地道東北人洒擦。一個月前我還...
沈念sama閱讀 48,025評論 2贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像怕膛，于是被迫代替她去往敵國和親熟嫩。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,843評論 2贊 354

「BioNano系列」光學(xué)圖譜混合組裝應(yīng)該怎么做斯碌？

「BioNano系列」光學(xué)圖譜混合組裝應(yīng)該怎么做一死？

評估從頭組裝結(jié)果

光學(xué)圖譜輔助組裝

單酶系統(tǒng)

推薦閱讀更多精彩內(nèi)容