在微生態(tài)研究中捡絮,當(dāng)我們做完16S或宏基因組測(cè)序等多樣性測(cè)序后,想找出不同處理組之間差異物種或差異基因莲镣,一般常用的組間差異分析metastats(只能用于兩組之間的差異比較)福稳、LEfSe、秩和檢驗(yàn)等瑞侮。對(duì)于不會(huì)編程的我的圆,該如何根據(jù)自己的數(shù)據(jù)特征選擇不同的差異統(tǒng)計(jì)方法并獲得相應(yīng)的差異分析結(jié)果呢?
今天小編將給大家介紹一款簡(jiǎn)單實(shí)用的組間差異分析軟件-STAMP半火,而且該軟件分析獲得的圖片可直接用于文章的發(fā)表越妈。
STAMP來(lái)源于2014年的文章(下圖),在短短的時(shí)間內(nèi)受到眾多科研者的青睞钮糖,目前其被引用240+次梅掠,非常值得肯定。該軟件的強(qiáng)大之處店归,不僅能夠?qū)山M甚至多組樣本及兩兩樣本之間的KEGG阎抒、COG、基因及任何分類水平的物種等進(jìn)行顯著性差異分析娱节,同時(shí)帶有10多種可選擇的差異檢驗(yàn)方法以及圖形展示形式(柱狀圖挠蛉,散點(diǎn)圖祭示,熱圖肄满,pca圖等)谴古。最重要的是,每種圖形基本上都能直接用于發(fā)表文章稠歉,而且該軟件的操作簡(jiǎn)單易學(xué)掰担。
STAMP軟件下載網(wǎng)址:http://kiwi.cs.dal.ca/Software/STAMP(可支持windows,linux及OS X多種操作系統(tǒng)怒炸,根據(jù)需要自行下載安裝带饱。該軟件的安裝也十分簡(jiǎn)單,按照默認(rèn)的參數(shù)選擇安裝即可)
言歸正傳阅羹,在使用STAMP軟件之前勺疼,首先需要準(zhǔn)備文件(豐度表文件和分組信息文件),文件的格式如下(以O(shè)TU豐度表為例)捏鱼。
1)豐度文件执庐,每列之間用tab鍵隔開(kāi)的txt文件(可在excel表格內(nèi)編輯,然后保存為txt格式文件导梆,需要注意的是該文件一定要包含表頭)
2)分組信息文件(格式同豐度表格式轨淌,該文件也需要加入表頭,否則會(huì)默認(rèn)第一行為表頭看尼,導(dǎo)致樣本缺失递鹉。)
準(zhǔn)備好以上資料后,我們就可以開(kāi)始一步兩步藏斩,跟著小編的步伐一起來(lái)~
1躏结、文件導(dǎo)入(方法File-load data,選擇文件導(dǎo)入狰域,注意文件存放的路徑中不能包含中文字符)
2窜觉、文件導(dǎo)入成功后,就可以設(shè)置參數(shù)北专,繪制專屬的圖片了禀挫。具體的參數(shù)設(shè)置見(jiàn)下圖:
該軟件默認(rèn)打開(kāi)界面Multiple groups(多組比較),根據(jù)實(shí)際需要的比較方案進(jìn)行選擇拓颓,比如想進(jìn)行兩組之間的比較语婴,首先點(diǎn)擊Two groups,然后選擇需要比較兩組的組名以及統(tǒng)計(jì)方法和過(guò)濾條件驶睦,即可進(jìn)行顯著性差異統(tǒng)計(jì)分析砰左。其中多組分析統(tǒng)計(jì)學(xué)方法包括ANOVA和Kruskal-Wallis H-test。
兩組之間比較統(tǒng)計(jì)學(xué)方法包括t-test(equalvariance)场航,Welch’s t-test和White’snon-parametric t-test缠导。為了確保統(tǒng)計(jì)學(xué)意義和結(jié)果的準(zhǔn)確度,需要選擇合適的檢驗(yàn)方法溉痢。t-test檢驗(yàn)可以在最少樣本數(shù)為4的時(shí)候保持較高的準(zhǔn)確度和精確度僻造,當(dāng)兩個(gè)分組之間具有相同的方差時(shí)憋他,用t-test更為準(zhǔn)確,當(dāng)方差不同時(shí)髓削,Welch’s t-test更為準(zhǔn)確竹挡。White’s non-parametrict-test算法計(jì)算時(shí)間較長(zhǎng),當(dāng)樣本數(shù)目少于8的時(shí)候立膛,可以使用該檢驗(yàn)方法揪罕,當(dāng)樣本數(shù)目過(guò)多時(shí),不宜使用該檢驗(yàn)方法宝泵。
3好啰、作圖類型和圖形導(dǎo)出
4、結(jié)果示例
5儿奶、STAMP軟件使用注意事項(xiàng)
1)STAMP作圖原始數(shù)據(jù)來(lái)源坎怪?
STAMP軟件可以直接使用QIIME的biom文件和PICRUST的KEGG和ko文件,groupfile需要老師根據(jù)自己實(shí)驗(yàn)設(shè)計(jì)進(jìn)行樣本分組廓握。
值得注意的是搅窿,這些結(jié)果文件存放路徑中不能存在中文字符,否則在數(shù)據(jù)無(wú)法導(dǎo)入到軟件隙券。比如文件路徑為:E:16Sstamp_dataOTU_table.txt(不存在中文字符是可以的)男应,如果文件路徑為E:stamp_分析OTU_table.txt(存在中文字符報(bào)錯(cuò))或者文件存在中文字符也是不行的,比如E:stamp_dataOTU_豐度表.txt
2) Unclassiffied選項(xiàng)中娱仔,remain Unclassiffied reads沐飘、remove Unclassiffied reads、和use only forcalculating frequency profiles 方法的區(qū)別牲迫?
當(dāng)輸入的豐度表文件和分組文件樣本不一致時(shí)耐朴,對(duì)該參數(shù)進(jìn)行設(shè)置。其中remain Unclassiffied reads和use only forcalculating frequency profiles方法會(huì)保留所有的數(shù)據(jù)盹憎,而removeUnclassiffied reads僅僅保留有確定分組信息的數(shù)據(jù)筛峭。注意的是,分組文件的樣本一定在豐度表文件中存在陪每,否則會(huì)報(bào)錯(cuò)影晓,反之,是可以的檩禾。
3)當(dāng)打開(kāi)了一個(gè)分析文件后挂签,如果再重新打開(kāi)新的文件會(huì)顯示錯(cuò)誤?
主要原因是目前版本的STAMP存在一些小的bug盼产,一次分析只能使用一個(gè)數(shù)據(jù)文件饵婆,如果要打開(kāi)新的數(shù)據(jù)文件,需要關(guān)閉軟件后重新打開(kāi)戏售。如果分析完成侨核,一定要記得保存哦草穆,不然需要再重新分析一次。
今天的技能分享就到這里了芹关,大家可以自行練習(xí)幾次哦~