10x scaffolding系列3:使用tigmint糾錯并進(jìn)行基因組scaffolding

背景介紹

這篇應(yīng)該是10x genomics數(shù)據(jù)輔助基因組組裝的最后一篇唉俗,tigmint也是這些軟件之中效果最好的一個,屬于壓箱底的好工具惊奇。并且這個軟件是個活著的軟件互躬,相比于那些GitHub上最后更新時間是兩三年前的軟件而言播赁,它還在不斷地動態(tài)更新中颂郎,在我寫這篇內(nèi)容的2022年10月30日的時候,這個軟件在3天前剛剛提交了一次更新容为。

而且tigmint安裝起來也愈加地方便了乓序,最初使用它的時候甚至只能用源碼安裝或者brew,現(xiàn)如今也支持conda一鍵安裝了坎背。

這里順便提一下tigmint的開發(fā)者替劈,是Shaun Jackman,根據(jù)他的簡歷(https://sjackman.ca/resume/), 他現(xiàn)在是10x genomcis的高級計算生物學(xué)家職位得滤,之前提到過的ARCS/ARKS也是他開發(fā)的陨献。也難怪tigmint處理10x數(shù)據(jù)的表現(xiàn)如此優(yōu)秀了。

根據(jù)GitHub上的介紹懂更,tigmint不但可以用10x的數(shù)據(jù)眨业,也可以使用nanopore數(shù)據(jù)匹耕。
tigmint的主要作用是識別并糾正錯誤組裝冕房。將10x/nanopore數(shù)據(jù)比對到基因組上之后,從比對結(jié)果中推斷出DNA大分子(large DNA molecules)范圍的谓传,因?yàn)楦鷨为?dú)的序列相比慷暂,DNA大分子的物理覆蓋位置更一致聘殖,更不容易出現(xiàn)覆蓋缺失的情況。在沒有覆蓋到的位置把基因組給斷開行瑞。tigmint會以bed文件的格式輸出需要切割的斷點(diǎn)位置奸腺。而在運(yùn)行tigmint的時候可以選擇結(jié)合使用ARCS或者ARKS做后續(xù)的處理,當(dāng)然也可以單獨(dú)使用tigmint糾錯血久。

軟件安裝

GitHub地址:https://github.com/bcgsc/tigmint

文章地址:https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-018-2425-6

conda install -c bioconda tigmint arcs links abyss seqtk

軟件運(yùn)行

前期處理

輸入文件要先把10x的原始數(shù)據(jù)用longranger basic進(jìn)行處理突照,處理完之后就可以直接輸給tigmint進(jìn)行組裝了。

longranger basic的使用可以參考10x的官網(wǎng):

https://support.10xgenomics.com/genome-exome/software/pipelines/latest/advanced/other-pipelines

運(yùn)行tigmint-make

tigmint-make的命令主要有3種模式:

  • 只調(diào)用tigmint進(jìn)行糾錯 tigmint-make tigmint
  • 糾錯加組裝 tigmint-make arcs洋魂,還有一個arcs-long模式
  • 糾錯+組裝+基于reference計算一個組裝的matrics绷旗。感覺這個應(yīng)該是有比較好的reference的情況下再進(jìn)行組裝才需要的喜鼓。
tigmint-make arcs draft=test.hic.hap2.p_ctg reads=10x_longranger_basic

注意事項(xiàng)

  1. draft和reads都只能是文件名,不能帶后綴衔肢,否則會報錯庄岖。
  2. draft(即基因組文件)得是.fa結(jié)尾的,如果是.fasta角骤,記得改成.fa才能運(yùn)行,否則會報找不到基因組文件的錯誤隅忿。
  3. 環(huán)境中安裝的samtools的版本不能太低,samtools sort命令里得有-t選項(xiàng)邦尊,似乎samtools的1.9或者1.10版本之后才更新出這個選項(xiàng)背桐,老版本的samtools運(yùn)行到后面會報找不到-t選項(xiàng)的錯誤。
  4. 運(yùn)行過程中可能會遇到/tmp滿了無法繼續(xù)寫入文件而中斷的問題蝉揍,解決辦法是在有空間的位置設(shè)置一個臨時文件夾链峭,把中間文件寫到我們自己設(shè)置的臨時文件夾中去。
mkdir tmpdir
# 記得把這一句寫入環(huán)境變量中哦又沾。
export TMPDIR=/path/to/tmpdir

萌哥碎碎念

  1. 我嘗試過tigmint-make arcstigmint-make arcs-long弊仪,arcs-long的結(jié)果里會引入更多的N,如果你后面還有Hi-C數(shù)據(jù)的話杖刷,沒有必要在這一步里引入不必要的N励饵,反正后面該打斷該連不上的都是會現(xiàn)出原形的。
  2. 如果你是手動安裝的ARCS滑燃,安裝的過程中可能會遇到sparsehash找不到的錯誤役听,但是這個不影響ARCS的使用。因?yàn)檫@個依賴是ARKS所需要的表窘,所以如果報錯了典予,只是影響ARKS的使用,ARCS還是能正常使用的蚊丐。一般而言熙参,從結(jié)果來看,ARCS要比ARKS要好麦备,只是ARKS更快罷了孽椰。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市凛篙,隨后出現(xiàn)的幾起案子黍匾,更是在濱河造成了極大的恐慌,老刑警劉巖呛梆,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件锐涯,死亡現(xiàn)場離奇詭異,居然都是意外死亡填物,警方通過查閱死者的電腦和手機(jī)纹腌,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門霎终,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人升薯,你說我怎么就攤上這事莱褒。” “怎么了涎劈?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵广凸,是天一觀的道長。 經(jīng)常有香客問我蛛枚,道長谅海,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任蹦浦,我火速辦了婚禮扭吁,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘白筹。我一直安慰自己智末,他們只是感情好谅摄,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布徒河。 她就那樣靜靜地躺著,像睡著了一般送漠。 火紅的嫁衣襯著肌膚如雪顽照。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天闽寡,我揣著相機(jī)與錄音代兵,去河邊找鬼。 笑死爷狈,一個胖子當(dāng)著我的面吹牛植影,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播涎永,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼思币,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了羡微?” 一聲冷哼從身側(cè)響起谷饿,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎妈倔,沒想到半個月后博投,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡盯蝴,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年毅哗,在試婚紗的時候發(fā)現(xiàn)自己被綠了听怕。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡虑绵,死狀恐怖叉跛,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蒸殿,我是刑警寧澤筷厘,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站宏所,受9級特大地震影響酥艳,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜爬骤,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一充石、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧霞玄,春花似錦骤铃、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至惫企,卻和暖如春撕瞧,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背狞尔。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工丛版, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人偏序。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓页畦,卻偏偏與公主長得像,于是被迫代替她去往敵國和親研儒。 傳聞我的和親對象是個殘疾皇子豫缨,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容