在微生物組研究中苍蔬,alpha diversity即“分析在單個樣本中有多少種不同的序列”游两;beta diversity即“分析在一定范圍內(nèi)樣本中骗卜,各種不同序列的分布情況”。
描述alpha diversity的方法有很多葵孤,其中有幾個比較常用,包括
- rarefaction curve(based on observed OTU numbers; based on Shannon index)
- PD score(phylogenetic diversity)
rarefaction curve(稀疏性曲線)
在每個樣本中不斷抽樣橱赠,每次都隨機抽取一定數(shù)量的序列尤仍,以抽取到的序列構(gòu)建OTU。其核心在于resampling病线。隨著抽取的序列數(shù)目不斷增加吓著,其構(gòu)建的OTU個數(shù)從迅速增加到趨于平坦,則說明抽樣的數(shù)目合理送挑,更多的序列不會再增加更多信OTU個數(shù)绑莺。即測序深度達到了要求。
如下圖所示惕耕,其X軸為測序深度(抽取的序列個數(shù))纺裁,Y軸如果為OTU個數(shù),則為rarefaction curve(based on observed OTU numbers),為香農(nóng)值(Shannon index)則為rarefaction curve(based on observed Shannon index)
下圖可以用R代碼來實現(xiàn)司澎,phyloseq
包可以用于繪制OTU number based的rarefaction curve, 不能現(xiàn)成繪制shannon based的欺缘。但是可以使用這段代碼來實現(xiàn)。
PD score(phylogenetic diversity)
PD score是結(jié)合OTUtable和OTU tree一同計算的挤安⊙枋猓考慮到了樣本在進化樹上的分布。一個OTU的來源越復(fù)雜蛤铜,其PD score越高嫩絮。來自進化樹上不同的地方越多丛肢,其PD score越高。
可以通過python里的skbio.diversity中的alpha_diversity模塊實現(xiàn)計算PD score剿干。
其input的OTUtable是行為sample_id, 列為OTU_id的形式蜂怎。以上鏈接中沒有具體例子,以下為一個實例置尔。
faith_PD = alpha_diversity('faith_pd', otu_T.values.tolist(), ids=list(otu.columns), otu_ids=list(otu.index), tree=tree)
# 'faith_pd'指定使用PD_score, 指定OTUtable, sample_id, 及tree文件杠步,得到每個樣本的PD score.