在微生物多樣性分析的報(bào)告中主要包括五個(gè)部分:Alpha多樣性分析炫隶、Beta多樣性分析、物種組成分析阎曹、進(jìn)化關(guān)系分析伪阶、差異分析,其中Alpha多樣性分析是生態(tài)學(xué)中生物多樣性的一個(gè)重要的組成部分处嫌,也是比較基礎(chǔ)的一部分栅贴。
Alpha多樣性是指一個(gè)特定區(qū)域或生態(tài)系統(tǒng)內(nèi)的多樣性,是反映豐富度和均勻度的綜合指標(biāo)熏迹。Alpha多樣性主要與兩個(gè)因素有關(guān):一是種類數(shù)目檐薯,即豐富度;二是多樣性注暗,群落中個(gè)體分配上的均勻性坛缕。群落豐富度(Community richness)的指數(shù)主要包括Chao1指數(shù)和ACE指數(shù)。群落多樣性(Community diversity)的指數(shù)捆昏,包括Shannon指數(shù)和Simpson指數(shù)赚楚。另外,還有測(cè)序深度指數(shù)Observed spieces 代表OTUs的直觀數(shù)量統(tǒng)計(jì), Good’s coverage 指計(jì)算加入豐度為1 的OTUs數(shù)目骗卜,加入低豐度影響宠页。
Alpha多樣性各指數(shù)的意義
Chao1:是用chao1 算法估計(jì)群落中含OTU 數(shù)目的指數(shù),chao1 在生態(tài)學(xué)中常用來估計(jì)物種總數(shù)寇仓,由Chao (1984) 最早提出举户。Chao1值越大代表物種總數(shù)越多。Schao1=Sobs+n1(n1-1)/2(n2+1)焚刺,其中Schao1為估計(jì)的OTU數(shù)敛摘,Sobs為觀測(cè)到的OTU數(shù),n1為只有一條序列的OTU數(shù)目乳愉,n2為只有兩條序列的OTU數(shù)目兄淫。Chao1指數(shù)越大屯远,表明群落的豐富度越高。
Ace:是用來估計(jì)群落中含有OTU 數(shù)目的指數(shù)捕虽,同樣由Chao提出(Chao and Yang, 1993)慨丐,是生態(tài)學(xué)中估計(jì)物種總數(shù)的常用指數(shù)之一。默認(rèn)將序列量10以下的OTU都計(jì)算在內(nèi)泄私,從而估計(jì)群落中實(shí)際存在的物種數(shù)房揭。ACE指數(shù)越大,表明群落的豐富度越高晌端。
Shannon:(Shannon, 1948a, b)綜合考慮了群落的豐富度和均勻度捅暴。Shannon指數(shù)值越高,表明群落的多樣性越高咧纠。
Simpson:用來估算樣品中微生物的多樣性指數(shù)之一蓬痒,由Edward Hugh Simpson ( 1949) 提出,在生態(tài)學(xué)中常用來定量的描述一個(gè)區(qū)域的生物多樣性漆羔。Simpson 指數(shù)值越大梧奢,說明群落多樣性越低。辛普森多樣性指數(shù)=1-隨機(jī)取樣的兩個(gè)個(gè)體屬于不同種的概率演痒。
alpha多樣性指數(shù)具體描述如下:
計(jì)算菌群豐度(Community richness)的指數(shù)有:
Chao?- the Chao1 estimator (http://scikit-bio.org/docs/latest/generated/generated/skbio.diversity.alpha.chao1.html#skbio.diversity.alpha.chao1);
ACE?- the ACE estimator (http://scikit-bio.org/docs/latest/generated/generated/skbio.diversity.alpha.ace.html#skbio.diversity.alpha.ace);
計(jì)算菌群多樣性(Community diversity)的指數(shù)有:
Shannon?- the Shannon index (http://scikit-bio.org/docs/latest/generated/generated/skbio.diversity.alpha.shannon.html#skbio.diversity.alpha.shannon);
Simpson?- the Simpson index (http://scikit-bio.org/docs/latest/generated/generated/skbio.diversity.alpha.simpson.html#skbio.diversity.alpha.simpson);
測(cè)序深度指數(shù)有:
Coverage - the Good’s coverage (http://scikit-bio.org/docs/latest/generated/generated/skbio.diversity.alpha.goods_coverage.html#skbio.diversity.alpha.goods_coverage)
alpha多樣性與豐度展示稀釋曲線
微生物多樣性分析中需要驗(yàn)證測(cè)序數(shù)據(jù)量是否足以反映樣品中的物種多樣性亲轨,稀釋曲線(豐富度曲線)可以用來檢驗(yàn)這一指標(biāo),并間接反映樣品中物種的豐富程度鸟顺。具體方法為:利用已測(cè)得16S rDNA序列中已知的各種OTU的相對(duì)比例惦蚊,來計(jì)算抽取n個(gè)(n小于測(cè)得reads序列總數(shù))reads時(shí)出現(xiàn)OTU數(shù)量的期望值,然后根據(jù)一組n值(一般為一組小于總序列數(shù)的等差數(shù)列)與其相對(duì)應(yīng)的OTU數(shù)量的期望值做出曲線來诊沪。當(dāng)曲線趨于平緩或者達(dá)到平臺(tái)期時(shí)也就可以認(rèn)為測(cè)序深度已經(jīng)基本覆蓋到樣品中所有的物種养筒;反之,則表示樣品中物種多樣性較高端姚,還存在較多未被測(cè)序檢測(cè)到的物種晕粪。
注:橫坐標(biāo)代表隨機(jī)抽取的序列數(shù)量;縱坐標(biāo)代表觀測(cè)到的OTU數(shù)量渐裸。樣本曲線的延伸終點(diǎn)的橫坐標(biāo)位置為該樣本的測(cè)序數(shù)量巫湘,如果曲線趨于平坦表明測(cè)序已趨于飽和,增加測(cè)序數(shù)據(jù)無法再找到更多的OTU昏鹃;反之表明不飽和尚氛,增加數(shù)據(jù)量可以發(fā)現(xiàn)更多OTU。Shannon-Winner曲線
Shannon-Wiener 曲線洞渤,是利用shannon指數(shù)來進(jìn)行繪制的阅嘶,反映樣品中微生物多樣性的指數(shù),利用各樣品的測(cè)序量在不同測(cè)序深度時(shí)的微生物多樣性指數(shù)構(gòu)建曲線,以此反映各樣本在不同測(cè)序數(shù)量時(shí)的微生物多樣性讯柔。 當(dāng)曲線趨向平坦時(shí)抡蛙,說明測(cè)序數(shù)據(jù)量足夠大,可以反映樣品中絕大多數(shù)的微生物物種信息魂迄。樣本曲線的延伸終點(diǎn)的橫坐標(biāo)位置為該樣本的測(cè)序數(shù)量粗截,如果曲線趨于平坦表明測(cè)序已趨于飽和,增加測(cè)序數(shù)據(jù)無法再找到更多的OTU捣炬;反之表明不飽和熊昌,增加數(shù)據(jù)量可以發(fā)現(xiàn)更多OTU。其中曲線的最高點(diǎn)也就是該樣本的Shannon指數(shù)湿酸,指數(shù)越高表明樣品的物種多樣性越高婿屹。
注:與上圖一樣,橫坐標(biāo)代表隨機(jī)抽取的序列數(shù)量稿械;縱坐標(biāo)代表的是反映物種多樣性的Shannon指數(shù)选泻。Rank-Abundance曲線
Rank-Abundance曲線用于同時(shí)解釋樣品多樣性的兩個(gè)方面,即樣品所含物種的豐富程度和均勻程度美莫。物種的豐富程度由曲線在橫軸上的長(zhǎng)度來反映,曲線越寬梯捕,表示物種的組成越豐富厢呵;物種組成的均勻程度由曲線的形狀來反映,曲線越平坦傀顾,表示物種組成的均勻程度越高襟铭。
注:橫坐標(biāo)代表物種排序的數(shù)量;縱坐標(biāo)代表觀測(cè)到的相對(duì)豐度跨晴。樣本曲線的延伸終點(diǎn)的橫坐標(biāo)位置為該樣本的物種數(shù)量螃壤,如果曲線越平滑下降表明樣本的物種多樣性越高领斥,而曲線快速陡然下降表明樣本中的優(yōu)勢(shì)菌群所占比例很高,多樣性較低哩都。
這部分內(nèi)容就講到這里,后期我們會(huì)介紹微生物多樣性beta多樣性分析婉徘,研究微生物的同學(xué)請(qǐng)保持關(guān)注哦漠嵌。
更多可觀看《微生物多樣性分析原理視頻課程》
參考文獻(xiàn)
[1]Shannon, C.E. (1948a). A mathematical theory of communication. The Bell System Technical Journal 27, 379-423.
[2]Shannon, C.E. (1948b). A mathematical theory of communication. The Bell System Technical Journal 27, 623-656.
[3]Simpson, E.H. (1949). Measurement of Diversity. Nature 163, 688.
[4]Chao, A., and Yang, M.C.K. (1993). Stopping rules and estimation for recapture debugging with unequal failure rates. Biometrika 80, 193-201.
[5]Chao, A. (1984). Nonparametric Estimation of the Number of Classes in a Population. Scandinavian Journal of Statistics 11, 265-270.
更多生物信息課程:
1. 文章越來越難發(fā)?是你沒發(fā)現(xiàn)新思路盖呼,基因家族分析發(fā)2-4分文章簡(jiǎn)單快速儒鹿,學(xué)習(xí)鏈接:基因家族分析實(shí)操課程、基因家族文獻(xiàn)思路解讀
2. 轉(zhuǎn)錄組數(shù)據(jù)理解不深入几晤?圖表看不懂约炎?點(diǎn)擊鏈接學(xué)習(xí)深入解讀數(shù)據(jù)結(jié)果文件,學(xué)習(xí)鏈接:轉(zhuǎn)錄組(有參)結(jié)果解讀蟹瘾;轉(zhuǎn)錄組(無參)結(jié)果解讀
3. 轉(zhuǎn)錄組數(shù)據(jù)深入挖掘技能-WGCNA圾浅,提升你的文章檔次墙贱,學(xué)習(xí)鏈接:WGCNA-加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析
4. 轉(zhuǎn)錄組數(shù)據(jù)怎么挖掘?學(xué)習(xí)鏈接:轉(zhuǎn)錄組標(biāo)準(zhǔn)分析后的數(shù)據(jù)挖掘贱傀、轉(zhuǎn)錄組文獻(xiàn)解讀
5.?微生物16S/ITS/18S分析原理及結(jié)果解讀惨撇、OTU網(wǎng)絡(luò)圖繪制、cytoscape與網(wǎng)絡(luò)圖繪制課程
6. 生物信息入門到精通必修基礎(chǔ)課府寒,學(xué)習(xí)鏈接:linux系統(tǒng)使用魁衙、perl入門到精通、perl語言高級(jí)株搔、R語言畫圖
7. 醫(yī)學(xué)相關(guān)數(shù)據(jù)挖掘課程剖淀,不用做實(shí)驗(yàn)也能發(fā)文章,學(xué)習(xí)鏈接:TCGA-差異基因分析纤房、GEO芯片數(shù)據(jù)挖掘纵隔、GSEA富集分析課程、TCGA臨床數(shù)據(jù)生存分析炮姨、TCGA-轉(zhuǎn)錄因子分析捌刮、TCGA-ceRNA調(diào)控網(wǎng)絡(luò)分析
8.其他課程鏈接:二代測(cè)序轉(zhuǎn)錄組數(shù)據(jù)自主分析、NCBI數(shù)據(jù)上傳舒岸、二代測(cè)序數(shù)據(jù)解讀绅作。