???[R包]ConsensusClusterPlus①一致性聚類Consensus Clustering

注:一致性聚類通常被用于確定最佳的聚類數(shù)目K


聚類分析

傳統(tǒng)方法的不足

  • 不能提供“客觀的”分類數(shù)目的標(biāo)準(zhǔn)和分類邊界,例如Hierarchical Clustering批狱。
  • 需要預(yù)先給定一個(gè)分類的數(shù)目氮惯,且沒有統(tǒng)一的標(biāo)準(zhǔn)去比較不同分類數(shù)目下分類的結(jié)果关面,例如K-means Clustering稚字。
  • 聚類結(jié)果的合理性和可靠性無法驗(yàn)證吠架。

一致聚類

  • 一致聚類通過基于重采樣的方法來驗(yàn)證聚類合理性
  • 一致聚類方法的主要目的是評(píng)估聚類的穩(wěn)定性

基本原理假設(shè)

從原數(shù)據(jù)集不同的子類中提取出的樣本構(gòu)成一個(gè)新的數(shù)據(jù)集怀薛,并且從同一個(gè)子類中有不同的樣本被提取出來落萎,那么在新數(shù)據(jù)集上聚類分析之后的結(jié)果悯许,無論是聚類的數(shù)目還是類內(nèi)樣本都應(yīng)該和原數(shù)據(jù)集相差不大仆嗦。因此所得到的聚類相對(duì)于抽樣變異越穩(wěn)定,我們?cè)娇梢韵嘈胚@一樣的聚類代表了一個(gè)真實(shí)的子類結(jié)構(gòu)先壕。重采樣的方法可以打亂原始數(shù)據(jù)集瘩扼,這樣對(duì)每一次重采樣的樣本進(jìn)行聚類分析然后再綜合評(píng)估多次聚類分析的結(jié)果給出一致性(Consensus)的評(píng)估。--上方描述參考自:福醫(yī)大生物信息學(xué)“一致性聚類”課件

#安裝ConsensusClusterPlus
if (!requireNamespace("BiocManager", quietly = TRUE))
  install.packages("BiocManager")
BiocManager::install("ConsensusClusterPlus")
#加載包
library(ConsensusClusterPlus)
#browseVignettes("ConsensusClusterPlus")#查看幫助文檔
ConsensusClusterPlus(d,maxK=10,reps=1000,pItem=0.8,pFeature=1,title="resultstrain",clusterAlg="km",distance="euclidean",seed=1262118388.71279,plot="pdf",writeTable=TRUE)

運(yùn)行上方代碼垃僚,會(huì)生成許多圖和表(上方的d是你的數(shù)據(jù)矩陣)

  • 你可以根據(jù)delta圖來選定k,通常選擇最后一個(gè)拐點(diǎn)集绰,所對(duì)應(yīng)的k為你的最佳k值


    delta圖
  • 該代碼還生成多個(gè)一致性聚類的圖,例如下圖


    image.png
  • 同時(shí)該函數(shù)也生成了每一個(gè)k值的分組情況谆棺,


    class

    分組情況:


    class

參考文檔

http://www.bioconductor.org/packages/release/bioc/vignettes/ConsensusClusterPlus/inst/doc/ConsensusClusterPlus.pdf
參考文獻(xiàn):ConsensusClusterPlus: a class discovery tool with confidence
assessments and item tracking

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末栽燕,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子改淑,更是在濱河造成了極大的恐慌碍岔,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,378評(píng)論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件朵夏,死亡現(xiàn)場(chǎng)離奇詭異蔼啦,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)仰猖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,970評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門捏肢,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人饥侵,你說我怎么就攤上這事鸵赫。” “怎么了爆捞?”我有些...
    開封第一講書人閱讀 168,983評(píng)論 0 362
  • 文/不壞的土叔 我叫張陵奉瘤,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我煮甥,道長(zhǎng)盗温,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,938評(píng)論 1 299
  • 正文 為了忘掉前任成肘,我火速辦了婚禮卖局,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘双霍。我一直安慰自己砚偶,他們只是感情好批销,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,955評(píng)論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著染坯,像睡著了一般均芽。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上单鹿,一...
    開封第一講書人閱讀 52,549評(píng)論 1 312
  • 那天掀宋,我揣著相機(jī)與錄音,去河邊找鬼仲锄。 笑死劲妙,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的儒喊。 我是一名探鬼主播镣奋,決...
    沈念sama閱讀 41,063評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼怀愧!你這毒婦竟也來了侨颈?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,991評(píng)論 0 277
  • 序言:老撾萬榮一對(duì)情侶失蹤掸驱,失蹤者是張志新(化名)和其女友劉穎肛搬,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體毕贼,經(jīng)...
    沈念sama閱讀 46,522評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡温赔,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,604評(píng)論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了鬼癣。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片陶贼。...
    茶點(diǎn)故事閱讀 40,742評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖待秃,靈堂內(nèi)的尸體忽然破棺而出拜秧,到底是詐尸還是另有隱情,我是刑警寧澤章郁,帶...
    沈念sama閱讀 36,413評(píng)論 5 351
  • 正文 年R本政府宣布枉氮,位于F島的核電站,受9級(jí)特大地震影響暖庄,放射性物質(zhì)發(fā)生泄漏聊替。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,094評(píng)論 3 335
  • 文/蒙蒙 一培廓、第九天 我趴在偏房一處隱蔽的房頂上張望惹悄。 院中可真熱鬧,春花似錦肩钠、人聲如沸泣港。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,572評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽当纱。三九已至呛每,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間惫东,已是汗流浹背莉给。 一陣腳步聲響...
    開封第一講書人閱讀 33,671評(píng)論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留廉沮,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 49,159評(píng)論 3 378
  • 正文 我出身青樓徐矩,卻偏偏與公主長(zhǎng)得像滞时,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子滤灯,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,747評(píng)論 2 361