「雜談」Nanopore組裝的擬南芥基因組效果如何?

使用的數據來自于一篇發(fā)在NC的擬南芥的基因組文章,文章用了minimap/miniasm 進行組裝季二,然后用racon和Pilon進行polish, 最后拼接處62 contigs 且N50 = 12.3?Mb谷徙。

wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR217/003/ERR2173373/ERR2173373.fastq.gz
seqkit seqkit fq2fa ERR2173373.fastq.gz | gzip -c > ERR2173373.fasta

我用的是Canu進行組裝拒啰,參數如下

canu \
    -p ath -d Athaliana\
    useGrid=true \
    gridOptions="-S /bin/sh -q wangjw" \
    gridEngineArrayMaxJobs=20 \
    gridEngineThreadsOption="-pe openmpi THREADS" gridEngineMemoryOption="-l mem_free=MEMORY" \
    minReadLength=2000 maxThreads=15 maxMemory=60G \
    genomeSize=100m \
    rawErrorRate=0.300 \
    correctedErrorRate=0.100 \
    -nanopore-raw ERR2173373.fasta.gz

Canu默認Pacbi的rawErroRate是0.300, Nanopore是0.500完慧。但是根據我在自己建立的基因組學群里的討論谋旦,目前nanopore的單條read的錯誤率大概是12%,所以兩條read在overlap的時候屈尼,最差估計會有24%以上的序列差異册着,于是我嘗試設置了0.300. 但是由于Nanopore的錯誤率不是完全隨機(經群里的小伙伴告知),所以糾錯后正確率低于Pacbio, 所以我設置了0.100. 其他參數沒有修改脾歧, 最終我拼出了360條contig甲捏,N50=4.45M。

我檢查了下最后輸出的report文件. 第一部分表明鞭执,大部分的reads都是能夠overlap司顿。

Part I

Part II 關于多少數據用于糾錯,以及預期留下多少數據兄纺。默認Canu只選擇最長的40X進行糾錯大溜,可以用corOutCoverage=100調整成100X. : rescued 表示的是剩下的沒有用于糾錯的read,他們可能是質粒囤热、線粒體等猎提。Canu保留的目的是為了避免在組裝時缺失序列信息。

Part II

Part III: 省下的就是由于太短,不能用于糾錯的部分锨苏。

Part III

最終結果疙教,我還用MUMMER分析了以下共線性,代碼如下伞租,

nucmer -t  20 --prefix ont2ath Athaliana.fa ath.contigs.fasta
mummerplot -p ont2ath ont2ath.delta --png --filter

基本上每條contig都主要和一條染色體存在很好的共線性贞谓,不存在contig的mis-assembly(錯誤組裝)現象。

共線性

下一步的計劃

  • 只Correction 不Trim 直接組裝葵诈,比較組裝效果
  • 提高糾錯前的錯誤率裸弦,保持糾錯后的0.1錯誤,比較組裝效果
  • 保持糾錯前的錯誤率作喘,提高糾錯后的錯誤率理疙,比較組裝效果
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市泞坦,隨后出現的幾起案子窖贤,更是在濱河造成了極大的恐慌,老刑警劉巖贰锁,帶你破解...
    沈念sama閱讀 212,816評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件赃梧,死亡現場離奇詭異,居然都是意外死亡豌熄,警方通過查閱死者的電腦和手機授嘀,發(fā)現死者居然都...
    沈念sama閱讀 90,729評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來锣险,“玉大人蹄皱,你說我怎么就攤上這事〈殉郑” “怎么了夯接?”我有些...
    開封第一講書人閱讀 158,300評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長纷妆。 經常有香客問我盔几,道長,這世上最難降的妖魔是什么掩幢? 我笑而不...
    開封第一講書人閱讀 56,780評論 1 285
  • 正文 為了忘掉前任逊拍,我火速辦了婚禮,結果婚禮上际邻,老公的妹妹穿的比我還像新娘芯丧。我一直安慰自己,他們只是感情好世曾,可當我...
    茶點故事閱讀 65,890評論 6 385
  • 文/花漫 我一把揭開白布缨恒。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪骗露。 梳的紋絲不亂的頭發(fā)上岭佳,一...
    開封第一講書人閱讀 50,084評論 1 291
  • 那天,我揣著相機與錄音萧锉,去河邊找鬼珊随。 笑死,一個胖子當著我的面吹牛柿隙,可吹牛的內容都是我干的叶洞。 我是一名探鬼主播,決...
    沈念sama閱讀 39,151評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼禀崖,長吁一口氣:“原來是場噩夢啊……” “哼衩辟!你這毒婦竟也來了?” 一聲冷哼從身側響起帆焕,我...
    開封第一講書人閱讀 37,912評論 0 268
  • 序言:老撾萬榮一對情侶失蹤惭婿,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后叶雹,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 44,355評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡换吧,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,666評論 2 327
  • 正文 我和宋清朗相戀三年折晦,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片沾瓦。...
    茶點故事閱讀 38,809評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡满着,死狀恐怖,靈堂內的尸體忽然破棺而出贯莺,到底是詐尸還是另有隱情风喇,我是刑警寧澤,帶...
    沈念sama閱讀 34,504評論 4 334
  • 正文 年R本政府宣布缕探,位于F島的核電站魂莫,受9級特大地震影響,放射性物質發(fā)生泄漏爹耗。R本人自食惡果不足惜耙考,卻給世界環(huán)境...
    茶點故事閱讀 40,150評論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望潭兽。 院中可真熱鬧倦始,春花似錦、人聲如沸山卦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至枚碗,卻和暖如春藻懒,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背视译。 一陣腳步聲響...
    開封第一講書人閱讀 32,121評論 1 267
  • 我被黑心中介騙來泰國打工嬉荆, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人酷含。 一個月前我還...
    沈念sama閱讀 46,628評論 2 362
  • 正文 我出身青樓鄙早,卻偏偏與公主長得像,于是被迫代替她去往敵國和親椅亚。 傳聞我的和親對象是個殘疾皇子限番,可洞房花燭夜當晚...
    茶點故事閱讀 43,724評論 2 351

推薦閱讀更多精彩內容