偶然發(fā)現(xiàn)2021年9月底10月初lefse基于python3版本重構(gòu)了及舍,意味著不用再為了兼容語法和包不斷的找python2的資源了(喜大普奔N戳尽>饴辍!)拙友,接下來看一下重構(gòu)后的lefse版本安裝與使用
安裝可以說是非常簡(jiǎn)單了歼郭,本文利用conda安裝,命令行如下:
conda create -n lefse?? ###建議創(chuàng)建獨(dú)立的lefse環(huán)境哦实撒,避免base環(huán)境下安裝的東西太亂,崩潰后不好修補(bǔ)哦=堇肌!负敏!
conda activate lefse
conda install -c bioconda lefse???????
接下來就是下載要進(jìn)行分析的demo數(shù)據(jù):
wget https://github.com/biobakery/biobakery/raw/master/demos/biobakery_demos/data/lefse/input/hmp_small_aerobiosis.txt -O hmp_aerobiosis_small.txt
開始分析:
lefse_format_input.py hmp_aerobiosis_small.txt hmp_aerobiosis_small.in -c 1 -s 2 -u 3 -o 1000000??? ###表格處理,將下載的表格處理成lefse后面幾個(gè)腳本分析需要使用的特定格式顶考,-c 1表示利用第一行作為分組的大類(主要分組)妖泄;-s 2表示表格第二行作為分組的小類(次級(jí)分組)驹沿,-u 3表示樣本名稱在第三行蹈胡,其中,-s和-u參數(shù)如果沒有需要給定參數(shù)值為-1(不可以不寫哦)却汉;-o 參數(shù)表示對(duì)樣本中同一分類層級(jí)的物種使其總豐度為1000000荷并,在差異物種較多時(shí),調(diào)用該參數(shù)
lefse_run.py hmp_aerobiosis_small.in hmp_aerobiosis_small.res? ###進(jìn)行統(tǒng)計(jì)分析
lefse_plot_res.py hmp_aerobiosis_small.res hmp_aerobiosis_small.png?? ###基于統(tǒng)計(jì)分析的結(jié)果繪制bar圖
lefse_plot_cladogram.py hmp_aerobiosis_small.res hmp_aerobiosis_small.cladogram.png --format png??? ###基于統(tǒng)計(jì)分析的結(jié)果繪制分類樹圖
mkdir biomarkers_raw_images? ###為下一步的每個(gè)物種分布bar圖繪制創(chuàng)建文件夾
lefse_plot_features.py hmp_aerobiosis_small.in hmp_aerobiosis_small.res biomarkers_raw_images/??? ###每個(gè)物種分布bar圖繪制創(chuàng)建文件夾
lefse_plot_res.py腳本生成圖片
lefse_plot_cladogram.py腳本生成圖片
lefse_plot_features.py腳本生成的其中一張圖片
有些小伙伴問可不可以將下面的表格轉(zhuǎn)成lefse可以用的樣子
以上兩個(gè)表格轉(zhuǎn)化成下面這張圖的樣子
結(jié)論是,當(dāng)然可以啦励两,本人寫了個(gè)腳本囊颅,python字典實(shí)現(xiàn),版權(quán)問題踢代,不展示啦!