MetaPhlAn2宏基因組物種注釋

導讀

上一篇介紹了MetaPhlAn:宏基因組微生物分類分析教程婿失,這次來學習MetaPhlAn2的使用方法。

bitbucket地址:https://bitbucket.org/biobakery/biobakery/wiki/metaphlan2

依賴:
Python (version >= 2.7)
Bowtie2
Numpy
Pandas (optional, only required by utility scripts)
BioPython (optional, only required by utility scripts)
SciPy (optional, only required by utility scripts)
Matplotlib (optional, only required by utility scripts)
biom (optional, only required for <tt class="docutils literal">biom</tt> format input/output)

一益缎、conda安裝

conda install -c bioconda metaphlan2

二、測序數(shù)據(jù)

windows下載:
SRS014476-Supragingival_plaque.fasta.gz
SRS014494-Posterior_fornix.fasta.gz
SRS014459-Stool.fasta.gz
SRS014464-Anterior_nares.fasta.gz
SRS014470-Tongue_dorsum.fasta.gz
SRS014472-Buccal_mucosa.fasta.gz

linux下載:

curl -O https://bitbucket.org/biobakery/biobakery/raw/tip/demos/biobakery_demos/data/metaphlan2/input/SRS014476-Supragingival_plaque.fasta.gz
curl -O https://bitbucket.org/biobakery/biobakery/raw/tip/demos/biobakery_demos/data/metaphlan2/input/SRS014494-Posterior_fornix.fasta.gz
curl -O https://bitbucket.org/biobakery/biobakery/raw/tip/demos/biobakery_demos/data/metaphlan2/input/SRS014459-Stool.fasta.gz

三验夯、MetaPhlAn2分析

1. 準備

mkdir metaphlan2_analysis
mv ~/Downloads/SRS*.fasta.gz metaphlan2_analysis/
cd metaphlan2_analysis
ls

2. 單樣品分析

# 分析第一個樣品
metaphlan2.py SRS014476-Supragingival_plaque.fasta.gz  --input_type fasta > SRS014476-Supragingival_plaque_profile.txt
# 查看比對結(jié)果
less -S SRS014476-Supragingival_plaque.fasta.gz.bowtie2out.txt
# 查看單樣品物種豐度表
less -S SRS014476-Supragingival_plaque_profile.txt
# 多線程模式芦圾,第2個樣品
metaphlan2.py SRS014459-Stool.fasta.gz --input_type fasta --nproc 4 > SRS014459-Stool_profile.txt

3. 多樣品分析

# 剩下的4個樣品
metaphlan2.py SRS014464-Anterior_nares.fasta.gz --input_type fasta --nproc 4 > SRS014464-Anterior_nares_profile.txt
metaphlan2.py SRS014470-Tongue_dorsum.fasta.gz --input_type fasta --nproc 4 > SRS014470-Tongue_dorsum_profile.txt
metaphlan2.py SRS014472-Buccal_mucosa.fasta.gz --input_type fasta --nproc 4 > SRS014472-Buccal_mucosa_profile.txt
metaphlan2.py SRS014494-Posterior_fornix.fasta.gz --input_type fasta --nproc 4 > SRS014494-Posterior_fornix_profile.txt

或者

# 一個循環(huán)完成6個樣品的分析
for f in SRS*.fasta.gz
do
    metaphlan2.py $f --input_type fasta --nproc 4 > ${f%.fasta.gz}_profile.txt
done

4. 六個樣品的物種豐度表
SRS014459-Stool_profile.txt
SRS014464-Anterior_nares_profile.txt SRS014470-Tongue_dorsum_profile.txt
SRS014472-Buccal_mucosa_profile.txt
SRS014476-Supragingival_plaque_profile.txt
SRS014494-Posterior_fornix_profile.txt

5. 六個樣品的比對結(jié)果
SRS014459-Stool.fasta.gz.bowtie2out.txt
SRS014464-Anterior_nares.fasta.gz.bowtie2out.txt
SRS014470-Tongue_dorsum.fasta.gz.bowtie2out.txt
SRS014472-Buccal_mucosa.fasta.gz.bowtie2out.txt
SRS014476-Supragingival_plaque.fasta.gz.bowtie2out.txt
SRS014494-Posterior_fornix.fasta.gz.bowtie2out.txt

6. 合并六個樣品的物種豐度表

merge_metaphlan_tables.py *_profile.txt > merged_abundance_table.txt

獲取結(jié)果總表:merged_abundance_table.txt

# 查看結(jié)果總表
less -S merged_abundance_table.txt

四昔案、hcluast2繪制熱圖

1. conda安裝hclust2

conda install -c biobakery hclust2

2. 提取種水平豐度信息

grep -E "(s__)|(^ID)" merged_abundance_table.txt | grep -v "t__" | sed 's/^.*s__//g' > merged_abundance_table_species.txt

3. 繪制熱圖

hclust2.py -i merged_abundance_table_species.txt -o abundance_heatmap_species.png --ftop 25 --f_dist_f braycurtis --s_dist_f braycurtis --cell_aspect_ratio 0.5 -l --flabel_size 6 --slabel_size 6 --max_flabel_len 100 --max_slabel_len 100 --minv 0.1 --dpi 300

五乒验、GraPhlAn繪制進化樹

1. conda安裝GraPhlAn

conda install -c biobakery graphlan

2. 準備輸入文件

獲取merged_abundance.tree.txt和merged_abunance.annot.txt

export2graphlan.py --skip_rows 1,2 -i merged_abundance_table.txt --tree merged_abundance.tree.txt --annotation merged_abundance.annot.txt --most_abundant 100 --abundance_threshold 1 --least_biomarkers 10 --annotations 5,6 --external_annotations 7 --min_clade_size 1

3. 繪制進化樹

獲取:
merged_abundance.xml
merged_abundance.png
merged_abundance_legend.png
merged_abundance_annot.png

graphlan_annotate.py --annot merged_abundance.annot.txt merged_abundance.tree.txt merged_abundance.xml
graphlan.py --dpi 300 merged_abundance.xml merged_abundance.png --external_legends

六愚隧、PanPhlAn繪制種水平heatmap

PanPhlAn教程

1. 輸入數(shù)據(jù)

MetaPhlAn intermediate bowtie2 output files

13530241_SF05.fasta.gz.bowtie2out.txt
13530241_SF06.fasta.gz.bowtie2out.txt
19272639_SF05.fasta.gz.bowtie2out.txt
19272639_SF06.fasta.gz.bowtie2out.txt
40476924_SF05.fasta.gz.bowtie2out.txt
40476924_SF06.fasta.gz.bowtie2out.txt

2. 創(chuàng)建所選物種豐度表

物種:s__Eubacterium_siraeum
豐度:大于1%

metaphlan2.py --input_type bowtie2out -t clade_specific_strain_tracker --clade s__Eubacterium_siraeum --min_ab 1.0 13530241_SF05.fasta.gz.bowtie2out.txt > 13530241_SF05.siraeum.txt
metaphlan2.py --input_type bowtie2out -t clade_specific_strain_tracker --clade s__Eubacterium_siraeum --min_ab 1.0 13530241_SF06.fasta.gz.bowtie2out.txt > 13530241_SF06.siraeum.txt
metaphlan2.py --input_type bowtie2out -t clade_specific_strain_tracker --clade s__Eubacterium_siraeum --min_ab 1.0 19272639_SF05.fasta.gz.bowtie2out.txt > 19272639_SF05.siraeum.txt
metaphlan2.py --input_type bowtie2out -t clade_specific_strain_tracker --clade s__Eubacterium_siraeum --min_ab 1.0 19272639_SF06.fasta.gz.bowtie2out.txt > 19272639_SF06.siraeum.txt
metaphlan2.py --input_type bowtie2out -t clade_specific_strain_tracker --clade s__Eubacterium_siraeum --min_ab 1.0 40476924_SF05.fasta.gz.bowtie2out.txt > 40476924_SF05.siraeum.txt
metaphlan2.py --input_type bowtie2out -t clade_specific_strain_tracker --clade s__Eubacterium_siraeum --min_ab 1.0 40476924_SF06.fasta.gz.bowtie2out.txt > 40476924_SF06.siraeum.txt

結(jié)果:
13530241_SF05.siraeum.txt
13530241_SF06.siraeum.txt
19272639_SF05.siraeum.txt
19272639_SF06.siraeum.txt
40476924_SF05.siraeum.txt
40476924_SF06.siraeum.txt

3. 結(jié)果合并

merge_metaphlan_tables.py *.siraeum.txt > siraeum_tracker.txt

4. 繪制熱圖

hclust2.py -i siraeum_tracker.txt -o siraeum_tracker.png --skip_rows 1 --f_dist_f hamming --no_flabels --dpi 300 --cell_aspect_ratio 0.01
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市锻全,隨后出現(xiàn)的幾起案子狂塘,更是在濱河造成了極大的恐慌,老刑警劉巖鳄厌,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件荞胡,死亡現(xiàn)場離奇詭異,居然都是意外死亡了嚎,警方通過查閱死者的電腦和手機赎瑰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事鱼冀。” “怎么了部念?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵穴翩,是天一觀的道長。 經(jīng)常有香客問我荸哟,道長假哎,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任鞍历,我火速辦了婚禮舵抹,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘劣砍。我一直安慰自己惧蛹,他們只是感情好,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布刑枝。 她就那樣靜靜地躺著香嗓,像睡著了一般。 火紅的嫁衣襯著肌膚如雪装畅。 梳的紋絲不亂的頭發(fā)上靠娱,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天,我揣著相機與錄音掠兄,去河邊找鬼像云。 笑死,一個胖子當著我的面吹牛蚂夕,可吹牛的內(nèi)容都是我干的迅诬。 我是一名探鬼主播,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼婿牍,長吁一口氣:“原來是場噩夢啊……” “哼百框!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起牍汹,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤铐维,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后慎菲,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體嫁蛇,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年露该,在試婚紗的時候發(fā)現(xiàn)自己被綠了睬棚。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖抑党,靈堂內(nèi)的尸體忽然破棺而出包警,到底是詐尸還是另有隱情,我是刑警寧澤底靠,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布害晦,位于F島的核電站,受9級特大地震影響暑中,放射性物質(zhì)發(fā)生泄漏壹瘟。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一鳄逾、第九天 我趴在偏房一處隱蔽的房頂上張望稻轨。 院中可真熱鬧,春花似錦雕凹、人聲如沸殴俱。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽线欲。三九已至,卻和暖如春俄精,著一層夾襖步出監(jiān)牢的瞬間询筏,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工竖慧, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留嫌套,地道東北人。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓圾旨,卻偏偏與公主長得像踱讨,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子砍的,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345