本文轉(zhuǎn)自:生信者言
建立在高通量測序基礎(chǔ)上的微生物群落研究躬充,當(dāng)前主要有三大類:基于16S/18S/ITS等擴增子做物種分類的Metataxanomics晒来、鳥槍法打斷全基因組DNA序列的Metagenomics和基于mRNA信息的宏轉(zhuǎn)錄組方法Meta-transcriptomics榨惰。
16S胀糜,也即是我們通常所說的微生物多樣性咧栗,是一種相對快速和經(jīng)濟適用的方法,但是PCR導(dǎo)致了偏好的產(chǎn)生衣洁,這就降低了注釋準(zhǔn)確度墓捻。此外,由于原核坊夫、真核生物的“分類標(biāo)簽”完全不同砖第,即使細(xì)菌和古菌的16S也相去甚遠(yuǎn),以進(jìn)化快著稱的病毒更難以捕獲环凿。宏基因組有效避免了擴增偏差梧兼,由于是直接打斷,理論上不限制物種(細(xì)菌拷邢、真菌袱院、古菌、真核生物等,事實上當(dāng)前宏基因組測序多還是以細(xì)菌為主)忽洛,可能組裝獲得新基因乃至新物種信息腻惠,但根據(jù)取樣情況可能存在少量或大量的宿主污染,因需組裝欲虚,數(shù)據(jù)量要求大集灌,成本貴、周期長复哆。宏轉(zhuǎn)錄組的好處是欣喧,跳出了DNA層面的束縛,可以獲得實時活躍的梯找、真正對群落有貢獻(xiàn)的基因和通路唆阿,然而mRNA不如DNA穩(wěn)定,此外多純化和擴增的步驟也可能引入錯誤。
關(guān)于16S的全流程锈锤,我在生信者言的千聊直播間里和大家做過系列課程分享驯鳖,ppt可聯(lián)系小秘書Anymore(微信號:genegogo007)獲取,另外久免,專門針對16S的生信分析浅辙,也給大家做過一個詳細(xì)的工具單和點評:《9個模塊+40余款軟件+老司機辣評 | 16S信息分析流程軟件和數(shù)據(jù)庫合集》。這里就不具體展開講了阎姥。
下面來說說大家關(guān)注的宏基因組记舆。宏基因組這部分,生信者言李木子童鞋也曾經(jīng)給大家做過系統(tǒng)梳理和點評:《精選30余款宏基因組分析軟件呼巴,來自老司機的使用經(jīng)驗總結(jié)(上篇)》泽腮、《精選30余款宏基因組分析軟件,來自老司機的使用經(jīng)驗總結(jié)(中篇)》衣赶、《精選30余款宏基因組分析軟件盛正,來自老司機的使用經(jīng)驗總結(jié)(下篇)》、《句句干貨屑埋!一文讀懂宏基因組binning》。
在17年發(fā)表于Briefings in Bioinformatics的一篇題為《A review of methods and databases for metagenomic classification and assembly》的綜述中痰滋,也有很多可參考的思路和軟件匯總摘能。
宏基因組經(jīng)典流程:環(huán)境微生物樣本--Total DNA提取--文庫構(gòu)建--上機測序(經(jīng)典短讀長: illumina系列;長讀長選擇: PB, ONT)--數(shù)據(jù)質(zhì)控(去除低質(zhì)量和接頭等敲街,去除宿主基因組等干擾信息)--宏基因組組裝--Contig Binning--基因組重建--分類注釋(可基于reads团搞、contig、bins多艇、還原出來的基因組做物種注釋)--其他下游分析逻恐。
質(zhì)控常用工具列表:
分類注釋工具匯總:
組裝和binning工具匯總:
嫌軟件太多、想要主流軟件推薦和評測的童鞋,可以轉(zhuǎn)回去看上一段給大家寫出來的來自李木子老師的流程軟件評測文复隆。
此外拨匆,再給大家推薦兩個流程集成軟件,MetAMOS ( https://github.com/marbl/metAMOS ) 和MOCAT2 ( https://github.com/mocat2/mocat2 ) 挽拂,有興趣的小伙伴可以試用下惭每。
下面我們再擴展一下,如何從宏基因組數(shù)據(jù)中鑒定病毒序列亏栈?15年P(guān)eerJ上介紹了一個適用于組裝后contig集中病毒序列識別的工具--Virsorter ( https://github.com/simroux/VirSorter )台腥,同年發(fā)表在Nucleic Acids Research上的另一篇文章提出了一個能把細(xì)菌和病毒序列分別識別鑒定出來的軟件--GOTTCHA ( Genomic Origins Through Taxonomic CHAllenge)。16年Microbiome上又報道了一款比Virsorter更適合短contig绒北、真陽性更高的軟件--VirFinder ( https://github.com/jessieren/VirFinder )黎侈,這塊軟件主要通過利用細(xì)菌和病毒在Kmer上的差異將病毒從宏基因組序列中抽離出來。此外闷游,宏病毒組也有流程集成類軟建峻汉,如16年發(fā)表于BMC genomics的ViromeScan ( https://sourceforge.net/projects/viromescan/ )和15年發(fā)表于Scientific Reports上的VIP ( https://github.com/keylabivdc/VIP )等。
再說說宏轉(zhuǎn)錄組储藐,東拼西湊的日子不好過俱济,現(xiàn)在宏轉(zhuǎn)錄組也迎來了自己的專屬軟件--IMSA+A ( https://github.com/JeremyCoxBMI/IMSA-A )。IMSA+A在17年1月發(fā)表于Microbiome钙勃,是一種可應(yīng)用于任意讀長宏轉(zhuǎn)錄組學(xué)數(shù)據(jù)蛛碌、可高效在同一份樣品中鑒定出細(xì)菌、真菌辖源、病毒的準(zhǔn)確的分類分析的方法蔚携。
事實上,在微生物組學(xué)研究中克饶,往往不會只使用一種檢測方法酝蜒,多組學(xué)聯(lián)用幾乎是各大研究論文必備殺器。宏轉(zhuǎn)錄組的單獨應(yīng)用就更少矾湃,多需和宏基因組結(jié)果結(jié)合起來分析⊥瞿裕現(xiàn)在的方法多是各組學(xué)單獨分析,從基因集和功能注釋結(jié)果做比較邀跃,但這樣其實并未解決不同組學(xué)天上地下十萬八千里的誤差霉咨,算作聯(lián)合分析也比較牽強。
16年底拍屑,盧森堡大學(xué)Paul Wilmes發(fā)表于Genome Biology的一篇Method介紹了一款神器--IMP途戒。IMP把整合宏基因組和宏轉(zhuǎn)錄組40多個工具整合在同一個平臺上,使用 docker engine 驅(qū)動以確保多系統(tǒng)的兼容性和可重復(fù)性僵驰。IMP重復(fù)性好喷斋,同時非常靈活方便唁毒,適用于很多宏基因組plus課題,而且相較MOCAT和MetAMOS能提供更多目標(biāo)基因星爪,給后續(xù)其他組學(xué)(如宏蛋白組學(xué))研究提供更好基礎(chǔ)浆西。
在當(dāng)年的冷泉港會議上Dr. Paul Wilmes也做了多組學(xué)聯(lián)合分析(MuSt)的工具流程(IMP)的報告,有興趣的小伙伴可以測試下移必,IMP的home在這里:http://r3lab.uni.lu/web/imp/室谚。
微生物組學(xué)研究正處在井噴期,研究工具也更新?lián)Q代的很快崔泵,這里總結(jié)的秒赤,僅可算滄海一粟。歡迎大家留言回復(fù)你的使用偏好和心得憎瘸,或來微信討論群里一起頭腦風(fēng)暴入篮!
參考文獻(xiàn):
A review of methods and databases for metagenomic classification and assembly.
MetAMOS: a modular and open source metagenomic assembly and analysis pipeline.
MOCAT2: a metagenomic assembly, annotation and profiling framework.
VirSorter: mining viral signal from microbial genomic data.
Accurate read-based metagenome characterization using a hierarchical suite of unique signatures
VirFinder: a novel k-mer based tool for identifying viral sequences from assembled metagenomic data.
ViromeScan: a new tool for metagenomic viral community profiling.
VIP: an integrated pipeline for metagenomics of virus identification and discovery.
A fast and robust protocol for metataxonomic analysis using RNAseq data.
IMP: a reproducible pipeline for reference-independent integrated metagenomic and metatranscriptomic analyses.