ZT:微生物組學(xué)數(shù)據(jù)分析工具綜述 | 16S+宏基因組+宏病毒組+宏轉(zhuǎn)錄組

本文轉(zhuǎn)自:生信者言

建立在高通量測序基礎(chǔ)上的微生物群落研究躬充,當(dāng)前主要有三大類:基于16S/18S/ITS等擴增子做物種分類的Metataxanomics晒来、鳥槍法打斷全基因組DNA序列的Metagenomics和基于mRNA信息的宏轉(zhuǎn)錄組方法Meta-transcriptomics榨惰。

16S胀糜,也即是我們通常所說的微生物多樣性咧栗,是一種相對快速和經(jīng)濟適用的方法,但是PCR導(dǎo)致了偏好的產(chǎn)生衣洁,這就降低了注釋準(zhǔn)確度墓捻。此外,由于原核坊夫、真核生物的“分類標(biāo)簽”完全不同砖第,即使細(xì)菌和古菌的16S也相去甚遠(yuǎn),以進(jìn)化快著稱的病毒更難以捕獲环凿。宏基因組有效避免了擴增偏差梧兼,由于是直接打斷,理論上不限制物種(細(xì)菌拷邢、真菌袱院、古菌、真核生物等,事實上當(dāng)前宏基因組測序多還是以細(xì)菌為主)忽洛,可能組裝獲得新基因乃至新物種信息腻惠,但根據(jù)取樣情況可能存在少量或大量的宿主污染,因需組裝欲虚,數(shù)據(jù)量要求大集灌,成本貴、周期長复哆。宏轉(zhuǎn)錄組的好處是欣喧,跳出了DNA層面的束縛,可以獲得實時活躍的梯找、真正對群落有貢獻(xiàn)的基因和通路唆阿,然而mRNA不如DNA穩(wěn)定,此外多純化和擴增的步驟也可能引入錯誤。


表1 三種技術(shù)的選擇策略

關(guān)于16S的全流程锈锤,我在生信者言的千聊直播間里和大家做過系列課程分享驯鳖,ppt可聯(lián)系小秘書Anymore(微信號:genegogo007)獲取,另外久免,專門針對16S的生信分析浅辙,也給大家做過一個詳細(xì)的工具單和點評:《9個模塊+40余款軟件+老司機辣評 | 16S信息分析流程軟件和數(shù)據(jù)庫合集》。這里就不具體展開講了阎姥。

下面來說說大家關(guān)注的宏基因組记舆。宏基因組這部分,生信者言李木子童鞋也曾經(jīng)給大家做過系統(tǒng)梳理和點評:《精選30余款宏基因組分析軟件呼巴,來自老司機的使用經(jīng)驗總結(jié)(上篇)》泽腮、《精選30余款宏基因組分析軟件,來自老司機的使用經(jīng)驗總結(jié)(中篇)》衣赶、《精選30余款宏基因組分析軟件盛正,來自老司機的使用經(jīng)驗總結(jié)(下篇)》《句句干貨屑埋!一文讀懂宏基因組binning》

在17年發(fā)表于Briefings in Bioinformatics的一篇題為《A review of methods and databases for metagenomic classification and assembly》的綜述中痰滋,也有很多可參考的思路和軟件匯總摘能。

宏基因組經(jīng)典流程:環(huán)境微生物樣本--Total DNA提取--文庫構(gòu)建--上機測序(經(jīng)典短讀長: illumina系列;長讀長選擇: PB, ONT)--數(shù)據(jù)質(zhì)控(去除低質(zhì)量和接頭等敲街,去除宿主基因組等干擾信息)--宏基因組組裝--Contig Binning--基因組重建--分類注釋(可基于reads团搞、contig、bins多艇、還原出來的基因組做物種注釋)--其他下游分析逻恐。


質(zhì)控常用工具列表:

分類注釋工具匯總:

組裝和binning工具匯總:

嫌軟件太多、想要主流軟件推薦和評測的童鞋,可以轉(zhuǎn)回去看上一段給大家寫出來的來自李木子老師的流程軟件評測文复隆。

此外拨匆,再給大家推薦兩個流程集成軟件,MetAMOS ( https://github.com/marbl/metAMOS ) 和MOCAT2 ( https://github.com/mocat2/mocat2 ) 挽拂,有興趣的小伙伴可以試用下惭每。

下面我們再擴展一下,如何從宏基因組數(shù)據(jù)中鑒定病毒序列亏栈?15年P(guān)eerJ上介紹了一個適用于組裝后contig集中病毒序列識別的工具--Virsorter ( https://github.com/simroux/VirSorter )台腥,同年發(fā)表在Nucleic Acids Research上的另一篇文章提出了一個能把細(xì)菌和病毒序列分別識別鑒定出來的軟件--GOTTCHA ( Genomic Origins Through Taxonomic CHAllenge)。16年Microbiome上又報道了一款比Virsorter更適合短contig绒北、真陽性更高的軟件--VirFinder ( https://github.com/jessieren/VirFinder )黎侈,這塊軟件主要通過利用細(xì)菌和病毒在Kmer上的差異將病毒從宏基因組序列中抽離出來。此外闷游,宏病毒組也有流程集成類軟建峻汉,如16年發(fā)表于BMC genomics的ViromeScan ( https://sourceforge.net/projects/viromescan/ )和15年發(fā)表于Scientific Reports上的VIP ( https://github.com/keylabivdc/VIP )等。

再說說宏轉(zhuǎn)錄組储藐,東拼西湊的日子不好過俱济,現(xiàn)在宏轉(zhuǎn)錄組也迎來了自己的專屬軟件--IMSA+A ( https://github.com/JeremyCoxBMI/IMSA-A )。IMSA+A在17年1月發(fā)表于Microbiome钙勃,是一種可應(yīng)用于任意讀長宏轉(zhuǎn)錄組學(xué)數(shù)據(jù)蛛碌、可高效在同一份樣品中鑒定出細(xì)菌、真菌辖源、病毒的準(zhǔn)確的分類分析的方法蔚携。

事實上,在微生物組學(xué)研究中克饶,往往不會只使用一種檢測方法酝蜒,多組學(xué)聯(lián)用幾乎是各大研究論文必備殺器。宏轉(zhuǎn)錄組的單獨應(yīng)用就更少矾湃,多需和宏基因組結(jié)果結(jié)合起來分析⊥瞿裕現(xiàn)在的方法多是各組學(xué)單獨分析,從基因集和功能注釋結(jié)果做比較邀跃,但這樣其實并未解決不同組學(xué)天上地下十萬八千里的誤差霉咨,算作聯(lián)合分析也比較牽強。

16年底拍屑,盧森堡大學(xué)Paul Wilmes發(fā)表于Genome Biology的一篇Method介紹了一款神器--IMP途戒。IMP把整合宏基因組和宏轉(zhuǎn)錄組40多個工具整合在同一個平臺上,使用 docker engine 驅(qū)動以確保多系統(tǒng)的兼容性和可重復(fù)性僵驰。IMP重復(fù)性好喷斋,同時非常靈活方便唁毒,適用于很多宏基因組plus課題,而且相較MOCAT和MetAMOS能提供更多目標(biāo)基因星爪,給后續(xù)其他組學(xué)(如宏蛋白組學(xué))研究提供更好基礎(chǔ)浆西。

在當(dāng)年的冷泉港會議上Dr. Paul Wilmes也做了多組學(xué)聯(lián)合分析(MuSt)的工具流程(IMP)的報告,有興趣的小伙伴可以測試下移必,IMP的home在這里:http://r3lab.uni.lu/web/imp/室谚。

微生物組學(xué)研究正處在井噴期,研究工具也更新?lián)Q代的很快崔泵,這里總結(jié)的秒赤,僅可算滄海一粟。歡迎大家留言回復(fù)你的使用偏好和心得憎瘸,或來微信討論群里一起頭腦風(fēng)暴入篮!

參考文獻(xiàn):

  1. A review of methods and databases for metagenomic classification and assembly.

  2. MetAMOS: a modular and open source metagenomic assembly and analysis pipeline.

  3. MOCAT2: a metagenomic assembly, annotation and profiling framework.

  4. VirSorter: mining viral signal from microbial genomic data.

  5. Accurate read-based metagenome characterization using a hierarchical suite of unique signatures

  6. VirFinder: a novel k-mer based tool for identifying viral sequences from assembled metagenomic data.

  7. ViromeScan: a new tool for metagenomic viral community profiling.

  8. VIP: an integrated pipeline for metagenomics of virus identification and discovery.

  9. A fast and robust protocol for metataxonomic analysis using RNAseq data.

  10. IMP: a reproducible pipeline for reference-independent integrated metagenomic and metatranscriptomic analyses.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市幌甘,隨后出現(xiàn)的幾起案子潮售,更是在濱河造成了極大的恐慌,老刑警劉巖锅风,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件酥诽,死亡現(xiàn)場離奇詭異,居然都是意外死亡皱埠,警方通過查閱死者的電腦和手機肮帐,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來边器,“玉大人训枢,你說我怎么就攤上這事⊥桑” “怎么了恒界?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長砚嘴。 經(jīng)常有香客問我十酣,道長,這世上最難降的妖魔是什么际长? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任婆誓,我火速辦了婚禮,結(jié)果婚禮上也颤,老公的妹妹穿的比我還像新娘。我一直安慰自己郁轻,他們只是感情好翅娶,可當(dāng)我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布文留。 她就那樣靜靜地躺著,像睡著了一般竭沫。 火紅的嫁衣襯著肌膚如雪燥翅。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天蜕提,我揣著相機與錄音森书,去河邊找鬼。 笑死谎势,一個胖子當(dāng)著我的面吹牛凛膏,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播脏榆,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼猖毫,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了须喂?” 一聲冷哼從身側(cè)響起吁断,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎坞生,沒想到半個月后仔役,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡是己,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年又兵,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赃泡。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡寒波,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出升熊,到底是詐尸還是另有隱情俄烁,我是刑警寧澤,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布级野,位于F島的核電站页屠,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏蓖柔。R本人自食惡果不足惜辰企,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望况鸣。 院中可真熱鬧牢贸,春花似錦、人聲如沸镐捧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至竹习,卻和暖如春誊抛,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背整陌。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工拗窃, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人泌辫。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓随夸,卻偏偏與公主長得像,于是被迫代替她去往敵國和親甥郑。 傳聞我的和親對象是個殘疾皇子逃魄,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,722評論 2 345