FAPROTAX預(yù)測16s擴(kuò)增子群落功能信息以及R語言可視化

FAPROTAX是一款適用于對環(huán)境樣本(如海洋、湖泊等)的生物地球化學(xué)循環(huán)過程(特別是碳、氫豫喧、氮、磷幢泼、硫等元素循環(huán))進(jìn)行功能注釋預(yù)測的軟件紧显。我們知道微生物與土壤養(yǎng)分的循環(huán)利用密切相關(guān),許多養(yǎng)分被植物利用過程中離不開微生物的作用缕棵,比如鸟妙,氮降解途徑中的亞硫酸鹽呼吸。

FAPROTAX原理

首先作者先根據(jù)文獻(xiàn)資料手動(dòng)構(gòu)建了聯(lián)系物種分類與功能注釋的FAPROTAX數(shù)據(jù)庫挥吵;后又編寫了聯(lián)系OTU分類表與FAPROTAX數(shù)據(jù)庫的python腳本重父;最后,只要將基于16S的OTU分類表通過python腳本就可以輸出微生物群落功能注釋預(yù)測結(jié)果忽匈。
另外房午,PICRUSt輸入的物種豐度表目前只能用Greengene數(shù)據(jù)庫進(jìn)行物種注釋,在這一點(diǎn)上FAPROTAX更靈活丹允,因?yàn)樗R別的是菌的屬郭厌、種的名稱,只要你注釋到的菌己被報(bào)導(dǎo)有這方面的功能雕蔽,無論注釋數(shù)據(jù)庫是Greengene折柠、Silva和RDP,OTU是有參考還是de novo的結(jié)果都可以識別批狐。
有關(guān)原理部分和使用部分可參考宏基因組—如何用FAPROTAX預(yù)測微生物群落功能扇售。網(wǎng)址:https://mp.weixin.qq.com/s/J8EwJD_PTDhqRaD7kXlK1A
但是出現(xiàn)一個(gè)問題上面這篇文章給出的FAPROTAX官網(wǎng)網(wǎng)址(https://www.zoology.ubc.ca/louca/FAPROTAX/lib/php/index.php?section=Instructions)似乎失效了前塔,無法下載該軟件。

2020.3.5

FAPROTAX官網(wǎng)的最新網(wǎng)址:https://pages.uoregon.edu/slouca/LoucaLab/archive/FAPROTAX/lib/php/index.php
可能需要翻墻才能訪問承冰,沒法翻墻的小伙伴也別急华弓,關(guān)注公眾號:Amoy數(shù)據(jù)分析,回復(fù)FAPROTAX即可下載最新版本的軟件困乒。
FAPROTAX官網(wǎng)

可以看到關(guān)于FAPROTAX的介紹寂屏,原理,使用代碼娜搂,如何下載選項(xiàng)迁霎,點(diǎn)擊下載選項(xiàng)可以看最新版本為1.2.1,點(diǎn)擊下載百宇。

軟件的安裝和使用

將下載的壓縮文件上傳至服務(wù)器或虛擬機(jī)考廉。這款軟件所需要的環(huán)境為Python2.7版本。

#解壓縮該文件
unzip FAPROTAX_1.2.1.zip
cd FAPROTAX_1.2.1 | ls 
#使用conda軟件創(chuàng)建名為envpython27的python=2.7環(huán)境恳谎,-n為創(chuàng)建環(huán)境的名稱芝此。
 conda create -n envpython27 python=2.7 -y
#激活python=2.7環(huán)境
 conda activate envpython27
#測試軟件能否正確運(yùn)行憋肖,如果可以運(yùn)行會(huì)出現(xiàn)參數(shù)信息因痛,報(bào)錯(cuò)說明不可用,再根據(jù)報(bào)錯(cuò)的信息解決岸更。
 python /home/ubuntu/FAPROTAX_1.2.1/collapse_table.py
#使用:-i otu分類信息表:-o 輸出文件名稱:-g 自帶的數(shù)據(jù)庫名稱鸵膏,在FAPROTAX_1.2.1/目錄下:-r 中間過程文件,可以看到那些菌屬?zèng)]有被數(shù)據(jù)庫對比上怎炊,其它具體使用請參考官網(wǎng)的教程谭企。
  python /home/ubuntu/FAPROTAX_1.2.1/collapse_table.py -i qiime1_otu.txt -o qii1_otu_tax_faprtax.txt -g /home/ubuntu/FAPROTAX_1.2.1/FAPROTAX.txt -r report.txt -v -d 'taxonomy'

輸入的otu分類表文件格式:案列中的qiime1_otu.txt文件


image.png

輸出文件qii2_otu_tax_faprtax.txt


image.png

使用R語言進(jìn)行可視化

以下操作在R語言中進(jìn)行,一共需要三個(gè)文件:上一步的輸出文件qii2_otu_tax_faprtax.txt评肆;分組文件design.txt债查;需要展示的功能列表文件IND.list。后兩個(gè)文件自己創(chuàng)建即可瓜挽。

#加載包和主題盹廷,我們做圖的最終目的是要發(fā)表的,統(tǒng)一的設(shè)置一個(gè)主題可以方便我們作圖久橙,圖形更加美觀
library(ggplot2)
main_theme = theme(panel.background=element_blank(), panel.grid=element_blank(),
                   axis.line.x=element_line(size=.5, colour="black"), axis.line.y=element_line(size=.5, colour="black"),
                   axis.ticks=element_line(color="black"), axis.text=element_text(color="black", size=),
                   legend.position="right", legend.background=element_blank(), legend.key=element_blank(), legend.text= 
 element_text(size=),
                   text=element_text(family="sans", size=))

alpha = read.table("qii2_otu_tax_faprtax.txt", header=T, row.names=1, sep="\t", comment.char="") 
alpha =alpha[,-1]#數(shù)據(jù)第一列是NA俄占,所以要去除
alpha = t(alpha)
alpha = alpha/100
alpha =as.data.frame(alpha)
design = read.table("design.txt", header=T, row.names=1, sep="\t")#SampleID為樣品編號與qii2_otu_tax_faprtax.txt第一行一致:subspecies為分組信息,對照組和處理組:solitype代表兩個(gè)不同地點(diǎn)淆衷。
design$group=design$groupID
sub_design = subset(design, group %in% c("MSXC","MSXT","XWZC","XWZT"))
sub_design$group  = factor(sub_design$group, levels=c("MSXC","MSXT","XWZC","XWZT"))
idx = rownames(sub_design) %in% rownames(alpha)
sub_design=sub_design[idx,]
# detach("package:ggpubr", unload=TRUE)
# library(dplyr)

list = read.table("IND.list", header=F,  sep="\t")#我們需要挑出來展示的功能缸榄,我關(guān)注的點(diǎn)是元素循環(huán)這塊,好像還有病原菌相關(guān)的祝拯,可根據(jù)自己的需要挑選
sub_alpha=alpha[rownames(sub_design), as.vector(list$V1)]
sub_alpha$sampleID=rownames(sub_alpha) 
melted = melt(sub_alpha, id.vars = "sampleID")
melted_all = merge(melted, sub_design[,c("subspecies","solitype")], by.x="sampleID", by.y = "row.names", all.x = T ) 
x = as.data.frame(melted_all %>% group_by(variable) %>%
                    summarise(mean = mean(value)))
x = x[order(x$mean, decreasing = T),]#排序
x = head(x, 10)#選取排名前10的進(jìn)行展示
melted_all = melted_all[melted_all$variable %in% x$variable,]
melted_all$variable = factor(melted_all$variable, levels = as.vector(x$variable))
melted_all$soiltype = factor(melted_all$solitype, levels=c("M", "X"))
p = ggplot(melted_all, aes(x=variable, y=value, color=subspecies)) +
  geom_boxplot(position = "dodge", alpha=1, outlier.size=0.3, size=0.5, width=0.7, fill="transparent") +
  #geom_jitter( position=position_jitter(0.17), size=0.3, alpha=0.7)+
  main_theme +
  facet_grid(soiltype ~ .)+#以soiltype 圖型分頁
  theme(axis.text.x=element_text(angle=45,vjust=1, hjust=1))
p
ggsave(paste("faprotax_IND_boxplot_top9..", ".pdf", sep=""), p, width = 8, height = 5)

design.txt文件格式甚带。


image.png

結(jié)果數(shù)據(jù)未發(fā)表,就使用劉永鑫大神他們做的圖Fig3

除了使用柱狀圖展示,還可使用熱圖等其它方式展示欲低。

致謝

公眾號宏基因組———如何用FAPROTAX預(yù)測微生物群落功能
R語言代碼來自文章———Zhang J , Liu Y X , Zhang N , et al. NRT1.1B is associated with root microbiota composition and nitrogen use in field-grown rice[J]. Nature Biotechnology, 2019.中Fig3中的代碼部分辕宏。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市砾莱,隨后出現(xiàn)的幾起案子瑞筐,更是在濱河造成了極大的恐慌,老刑警劉巖腊瑟,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件聚假,死亡現(xiàn)場離奇詭異,居然都是意外死亡闰非,警方通過查閱死者的電腦和手機(jī)膘格,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來财松,“玉大人瘪贱,你說我怎么就攤上這事×菊保” “怎么了菜秦?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長舶掖。 經(jīng)常有香客問我球昨,道長,這世上最難降的妖魔是什么眨攘? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任主慰,我火速辦了婚禮,結(jié)果婚禮上鲫售,老公的妹妹穿的比我還像新娘共螺。我一直安慰自己,他們只是感情好情竹,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布藐不。 她就那樣靜靜地躺著,像睡著了一般鲤妥。 火紅的嫁衣襯著肌膚如雪佳吞。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天棉安,我揣著相機(jī)與錄音底扳,去河邊找鬼。 笑死贡耽,一個(gè)胖子當(dāng)著我的面吹牛衷模,可吹牛的內(nèi)容都是我干的鹊汛。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼阱冶,長吁一口氣:“原來是場噩夢啊……” “哼刁憋!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起木蹬,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤至耻,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后镊叁,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體尘颓,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年晦譬,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了疤苹。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡敛腌,死狀恐怖卧土,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情像樊,我是刑警寧澤尤莺,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站凶硅,受9級特大地震影響缝裁,放射性物質(zhì)發(fā)生泄漏扫皱。R本人自食惡果不足惜足绅,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望韩脑。 院中可真熱鬧氢妈,春花似錦、人聲如沸段多。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽进苍。三九已至加缘,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間觉啊,已是汗流浹背拣宏。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留杠人,地道東北人勋乾。 一個(gè)月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓宋下,卻偏偏與公主長得像,于是被迫代替她去往敵國和親辑莫。 傳聞我的和親對象是個(gè)殘疾皇子学歧,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容