1.PICRUSt簡介
PICRUSt全稱為Phylogenetic Investigationof Communities by Reconstruction of Unobserved States,由Langille等人于2013年開發(fā)逗物,文章發(fā)表在Nature Biotechnology上(Langille et al. 2013)招刨。它是最早被開發(fā)的基于16S rRNA基因序列預(yù)測(cè)微生物群落功能的工具,包括在線版(http://huttenhower.sph.harvard.edu/galaxy/root?tool_id=PICRUSt_normalize)和基于MacOS X或Linux系統(tǒng)的下載安裝版(http://picrust.github.io/picrust/install.html#install)。
原理
如圖1所示,其預(yù)測(cè)過程分兩步:
(1)基因內(nèi)容預(yù)測(cè)(gene content inference)。該步先對(duì)Greengenes數(shù)據(jù)庫的“closed reference”序列劃分OTU后構(gòu)建進(jìn)化樹根蟹,通過祖先狀態(tài)重構(gòu)(Ancestralstate reconstruction)算法并結(jié)合IMG/M數(shù)據(jù)庫,預(yù)測(cè)出樹中未進(jìn)行全基因組測(cè)序OTU的基因組信息糟秘。
(2)宏基因組預(yù)測(cè)(metagenome inference)简逮。將16SrDNA測(cè)序結(jié)果與Greengenes數(shù)據(jù)庫進(jìn)行比對(duì),挑選出與“closed reference”數(shù)據(jù)庫相似性高的(默認(rèn)為≥97%)OTU尿赚;根據(jù)OTU對(duì)應(yīng)基因組中16SrDNA的拷貝數(shù)信息散庶,將每個(gè)OTU對(duì)應(yīng)序列數(shù)除以其16S拷貝數(shù)來進(jìn)行標(biāo)準(zhǔn)化;最后凌净,將標(biāo)準(zhǔn)化的數(shù)據(jù)乘以其對(duì)應(yīng)的基因組中基因含量從而實(shí)現(xiàn)宏基因組預(yù)測(cè)的目的悲龟。獲得的預(yù)測(cè)結(jié)果可以通過KEGG Orthology、COGs或Pfams等對(duì)基因家族進(jìn)行分類冰寻。
2.在conda下picrust2的安裝
source activate qiime2-2018.8 #激活環(huán)境
conda install -c anaconda -c defaults-chttps://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda? ? -c https://conda.anaconda.org/biocore q2-fragment-insertion? #安裝fragment-insertion插件
conda install -c conda-forge -c bioconda -c gavinmdouglas q2-picrust2 #一步安裝
3.picrust2的使用
先進(jìn)行Vsearch须教,需要?table.qza,rep-seqs.qza,99-otu.qza文件斩芭,得到 table-cr-99.qza轻腺, rep-seqs-cr-99.qza,unmatched-cr-99.qza文件
qiime vsearch cluster-features-closed-reference \
? ? --i-table table.qza \
? ? --i-sequences rep-seqs.qza \
? ? --i-reference-sequences 99_otus.qza \
? ? --p-perc-identity 0.99 \
? ? --o-clustered-table table-cr-99.qza \
? ? --o-clustered-sequences rep-seqs-cr-99.qza \
? ? --o-unmatched-sequences unmatched-cr-99.qza
# preparative file: table-cr-99.qza,rep-seqs-cr-99.qza,reference.fna.qza,reference.tre.qza
qiime fragment-insertion sepp \
? ? ? ? ? --i-representative-sequences rep-seqs-cr-99.qza \
? ? ? ? ? --p-threads 1 \
? ? ? ? ? --i-reference-alignment reference.fna.qza \
? ? ? ? ? --i-reference-phylogeny reference.tre.qza \
? ? ? ? ? --output-dir tutorial_placed_out
qiime picrust2 custom-tree-pipeline \
? ? ? ? ? --i-table table-cr-99.qza \
? ? ? ? ? --i-tree tutorial_placed_out/tree.qza \
? ? ? ? ? --output-dir q2-picrust2_output \
? ? ? ? ? --p-threads 1 --p-hsp-method pic \
? ? ? ? ? --p-max-nsti 2
qiime feature-table summarize \
? ? ? ? ? --i-table q2-picrust2_output/pathway_abundance.qza \
? ? ? ? ? --o-visualization q2-picrust2_output/pathway_abundance.qzv
qiime diversity core-metrics \
? ? ? ? ? --i-table q2-picrust2_output/pathway_abundance.qza \
? ? ? ? ? --p-sampling-depth 3192 \? ? #根據(jù)最小樣本深度,在 table-cr-99.qza文件中找
? ? ? ? ? --m-metadata-file sample-metadata.tsv \
? ? ? ? ? --output-dir pathabun_core_metrics_out \
? ? ? ? ? --p-n-jobs 1