你知道如何聚類嗎抄瓦?層次聚類與聚類樹

原文鏈接(可關(guān)注公眾號微生態(tài)與微進化索取示例數(shù)據(jù)):

層次聚類與聚類樹

比較聚類:我該劃分多少個聚類簇?

聚類分析

在生態(tài)學(xué)研究當中陶冷,有些環(huán)境中的對象是連續(xù)(或者離散)的钙姊,而有些對象是不連續(xù)的,聚類的目的是識別在環(huán)境中不連續(xù)的對象子集埂伦,從而探索隱藏在數(shù)據(jù)背后的屬性特征煞额。聚類分析主要處理那些對象有足夠的相似性被歸于一組,并且確定組與組之間的差異或分離程度。聚類可以分為特征聚類(Vector Clustering)和圖聚類(Graph Clustering)立镶。特征聚類是指根據(jù)對象的特征向量矩陣來計算距離或者相關(guān)性來實現(xiàn)聚類,例如各種層次聚類和非層次聚類类早。而圖聚類則針對的是復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)媚媒,有隨機游走、貪心策略涩僻、標簽傳播等算法等缭召。

根據(jù)對象歸屬方法,有以下兩種:

⑴硬劃分逆日,也即將總體劃分為不同的部分嵌巷,每個對象或者變量只能歸屬于某一組(身份信息為0或1)。

⑵模糊劃分室抽,對象歸屬身份信息可以是連續(xù)的搪哪,也即身份信息可以是0到1中間的任意值。

聚類的結(jié)果可以輸出為無層級分組坪圾,也可以是具有嵌套結(jié)構(gòu)的層次聚類樹晓折。非約束的聚類分析只是一種數(shù)據(jù)劃分,不是典型的統(tǒng)計方法兽泄,因此不必進行統(tǒng)計檢驗漓概,但是約束的聚類分析(多元回歸樹)需要進行統(tǒng)計檢驗。

層次聚類

層次聚類(hierarchical clustering)就是通過對數(shù)據(jù)集按照某種方法進行層次分解病梢,直到滿足某種條件為止胃珍。在R中最常用的為stats包中的hclust()函數(shù)。

⑴單連接聚合聚類

單連接聚合聚類(singlelinkage agglomerative clustering)也稱作最近鄰分類(nearestneighbour sorting)蜓陌,依據(jù)最短的成對距離或最大相似性來依次連接對象直到連接完畢觅彰,兩個組之間最近的兩個對象之間距離即為組的距離。此方法一般使用弦距離矩陣(歐氏距離)進行分析护奈,在hclust()函數(shù)中為"single"缔莲。

⑵完全連接聚合聚類

完全連接聚合聚類(completelinkage agglomerative clustering)也稱作最遠鄰分類(furthestneighbour sorting),依據(jù)最遠距離決定一個對象或者一個組是否與另一個組聚合霉旗,所有對象之間的距離必須完全計算然后進行比較痴奏。単連接聚合聚類更容易體現(xiàn)數(shù)據(jù)的梯度,而完全連接聚合聚類分類組之間差異更加明顯厌秒。在在hclust()函數(shù)中為"complete"读拆。

⑶平均聚合聚類

平均聚合聚類(averageagglomerative clustering)是一類基于對象之間平均相異性或者聚類簇形心(centroid)的進行聚類的方法。一個對象加入一個組依據(jù)的是這個對象與這個組成員的平均距離鸵闪。在hclust()函數(shù)中有等權(quán)重算術(shù)平均聚類"average"(UPGMA)檐晕、不等權(quán)重算術(shù)平均聚類"mcquitty"(WPGMA)、等權(quán)重形心聚類"centroid"(UPGMC)、不等權(quán)重形心聚類"median"(WPGMC)四種方法辟灰。在生態(tài)學(xué)中Bray-Curtis距離矩陣一般使用方法"average"進行分析个榕,其聚類樹結(jié)構(gòu)介于單連接和完全連接聚類之間。

⑷最小方差聚類

Ward最小方差聚類是一種基于最小二乘法線性模型準則的聚類方法芥喇。分組的依據(jù)是使組內(nèi)距離平方和(方差)最小化西采,由于使用了距離的平方,常常使聚類樹基部過于膨脹继控,可取平方根再進行可視化械馆。在hclust()函數(shù)中有"ward.D"、"ward.D2"兩種方法武通。

聚類樹

聚類樹是聚類分析最常用的可視化方法霹崎。這里以微生物群落抽平后的otu table數(shù)據(jù)為例進行分析,計算Bray-Curtis距離矩陣并進行UPGMA聚類:

#讀取群落數(shù)據(jù)并計算Bray-Curtis距離矩陣

data=read.table(file="sample.subsample.otu_table.txt", header=T, check.names=FALSE)

rownames(data)=data[,1]

data=data[,-1]

library(vegan)

data=decostand(data, MARGIN=2, "total")

otu=t(data)

otu_dist=vegdist(otu, method="bray", diag=TRUE, upper=TRUE, p=2)

#進行聚類分析并作圖

hclust=hclust(otu_dist, method="average")

plot(hclust)

聚類樹示例

其中縱坐標為Bray-Curtis距離冶忱,越往樹的基部(上圖頂端)距離越大尾菇,樹枝節(jié)點對應(yīng)的縱坐標值為兩個對象/聚類簇之間的距離/平均距離。

更多的展示方法:

多種多樣的聚類樹

聚類簇劃分與美化:



比較聚類

不同對象之間的關(guān)系可以通過聚類樹展現(xiàn)出來朗和,通過聚類樹我們可以觀察哪些對象比較相似错沽,哪些對象距離較遠,從而對所有對象的關(guān)系有一個整體的把握眶拉。然而千埃,這時候我們并沒有獲得一個明顯的聚類簇劃分,也即不知道對象可以劃分為幾類忆植、誰和誰歸為一類放可,以及這個聚類結(jié)果是不是合理,這可以通過比較聚類來實現(xiàn)朝刊。

同表型相關(guān)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末耀里,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子拾氓,更是在濱河造成了極大的恐慌冯挎,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件咙鞍,死亡現(xiàn)場離奇詭異房官,居然都是意外死亡,警方通過查閱死者的電腦和手機续滋,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進店門翰守,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人疲酌,你說我怎么就攤上這事蜡峰×嗽” “怎么了?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵湿颅,是天一觀的道長载绿。 經(jīng)常有香客問我,道長油航,這世上最難降的妖魔是什么卢鹦? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮劝堪,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘揉稚。我一直安慰自己秒啦,他們只是感情好,可當我...
    茶點故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布搀玖。 她就那樣靜靜地躺著余境,像睡著了一般。 火紅的嫁衣襯著肌膚如雪灌诅。 梳的紋絲不亂的頭發(fā)上芳来,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天,我揣著相機與錄音猜拾,去河邊找鬼即舌。 笑死,一個胖子當著我的面吹牛挎袜,可吹牛的內(nèi)容都是我干的顽聂。 我是一名探鬼主播,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼盯仪,長吁一口氣:“原來是場噩夢啊……” “哼紊搪!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起全景,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤耀石,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后爸黄,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體滞伟,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年馆纳,在試婚紗的時候發(fā)現(xiàn)自己被綠了诗良。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡鲁驶,死狀恐怖鉴裹,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤径荔,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布督禽,位于F島的核電站,受9級特大地震影響总处,放射性物質(zhì)發(fā)生泄漏狈惫。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一鹦马、第九天 我趴在偏房一處隱蔽的房頂上張望胧谈。 院中可真熱鬧,春花似錦荸频、人聲如沸菱肖。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽稳强。三九已至,卻和暖如春和悦,著一層夾襖步出監(jiān)牢的瞬間退疫,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工鸽素, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留褒繁,地道東北人。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓馍忽,卻偏偏與公主長得像澜汤,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子舵匾,可洞房花燭夜當晚...
    茶點故事閱讀 42,901評論 2 345

推薦閱讀更多精彩內(nèi)容