K均值法

library(fpc)#使用kmeansruns函數(shù)
library(mlbench)#使用數(shù)據(jù)
library(ggplot2)
data('Vehicle',package = 'mlbench')
data<-Vehicle[,-19]
set.seed(1111)
##combine opel and saab to car
class<-Vehicle[,19]
levels(class)[levels(class)=='saab']<-'car'
levels(class)[levels(class)=='opel']<-'car'
ggplot(data=Vehicle,aes(x=class))+geom_bar()
fit<-kmeansruns(data,krange = 1:8,
                criterion='ch',
                runs=100,
                scaledata=TRUE,
                critout = TRUE,
               )

attributes(fit)
table(fit$cluster,class)
#class
#bus car van
#1 161 195 195
#2  57 234   4
##聚類2可能代表了car?

模糊k均值法:允許樣本屬于多個簇

library(fclust)
fit2<-FKM(data,k=2,m=2,RS=10,stand=1)
attributes(fit2)
head(fit2$clus)#查看聚類的概率

table(fit2$clus[,1],class)
#class
##bus car van
#1 158 186 195
#2  60 243   4
###可以通過評測聚類有效值犀勒,如輪廓值來評估最佳K值
Fclust.index(fit2,index = 'SIL.F')
#The default value alpha=1 has been set for computing SIL.F 
#[1] 0.6353147

系統(tǒng)聚類分析爵卒,即層次聚類

library(pvclust)
data<-scale(data)
set.seed(2021)
fit3<-pvclust(data,
              method.hclust = 'ward.D',
              nboot = 5000,
              method.dist = 'euclidean')
##上述函數(shù)通過hclust函數(shù)進行聚類分析
print(fit3)
#結果中au為近似無偏P值锌仅,bp為自助概率P值,se.au表示對自身P值的估計
plot(fit3)
pvrect(fit3,alpha = 0.95)

從數(shù)據(jù)集中隨機抽取子集數(shù)據(jù)瞎抛,然后進行這些子集數(shù)據(jù)長度聚類分析艺演。再進行大量多次的循環(huán)運算,計算每個聚類簇發(fā)生的次數(shù)比例(自助概率BP
利用不同抽樣規(guī)模的重抽樣來估計每個聚類簇的p值桐臊,產(chǎn)生AUP值(近似無偏P值)胎撤。

高AU值的聚類簇表示受到數(shù)據(jù)的高度支持。

image.png

au 的P值95%的區(qū)間

image.png

基于模型聚類断凶,假定數(shù)據(jù)是服從高斯分布的

library(mclust)
library(dplyr)
set.seed(1111)
data<-Vehicle[,-19]
fit4<-Mclust(as.matrix(data),G=1:8,modelNames =c("EII", "VII", "EEI", "EVI", "VEI", "VVI"))#將模型分為1-8個高斯成分,通過貝葉斯信息準則來選擇最佳模型
?Mclust
attributes(fit4)
fit4$modelName#最佳模型
fit4$BIC#根據(jù)BIC選最佳個數(shù)
head(fit4$BIC)
bic<-as.matrix(fit4$BIC)
attributes(bic)
bic<-matrix(data=bic[1:48],
            nrow=8,ncol=6,
            byrow = FALSE,
            dimnames = list(1:8,c('EII','VII','EEI','EVI','VEI','VVI')))
bic<-as.data.frame(bic)
bic<-mutate(bic,num=1:8)
ggplot()+
  geom_line(data=bic,aes(x=num,y=EII,colour='EII'))+
  geom_point(data =bic,aes(x=num,y=EII,colour='EII'))+
  geom_line(data=bic,aes(x=num,y=VII,colour='VII'))+
  geom_point(data =bic,aes(x=num,y=VII,colour='VII'))+
  geom_line(data=bic,aes(x=num,y=EEI,colour='EEI'))+
  geom_point(data =bic,aes(x=num,y=EEI,colour='EEI'))+
  geom_line(data=bic,aes(x=num,y=EVI,colour='EVI'))+
  geom_point(data =bic,aes(x=num,y=EVI,colour='EVI'))+
  geom_line(data=bic,aes(x=num,y=VEI,colour='VEI'))+
  geom_point(data =bic,aes(x=num,y=VEI,colour='VEI'))+
  geom_line(data=bic,aes(x=num,y=VVI,colour='VVI'))+
  geom_point(data =bic,aes(x=num,y=VVI,colour='VVI'))+
  ylab('GIC')
  #從2開始平緩伤提,所以選擇2或者3作為聚類個數(shù)
                                                                        
                                                                                                                                         
image.png
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市认烁,隨后出現(xiàn)的幾起案子肿男,更是在濱河造成了極大的恐慌,老刑警劉巖却嗡,帶你破解...
    沈念sama閱讀 211,817評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件次伶,死亡現(xiàn)場離奇詭異,居然都是意外死亡稽穆,警方通過查閱死者的電腦和手機冠王,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,329評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來舌镶,“玉大人柱彻,你說我怎么就攤上這事豪娜。” “怎么了哟楷?”我有些...
    開封第一講書人閱讀 157,354評論 0 348
  • 文/不壞的土叔 我叫張陵瘤载,是天一觀的道長。 經(jīng)常有香客問我卖擅,道長鸣奔,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,498評論 1 284
  • 正文 為了忘掉前任惩阶,我火速辦了婚禮挎狸,結果婚禮上,老公的妹妹穿的比我還像新娘断楷。我一直安慰自己锨匆,他們只是感情好,可當我...
    茶點故事閱讀 65,600評論 6 386
  • 文/花漫 我一把揭開白布冬筒。 她就那樣靜靜地躺著恐锣,像睡著了一般。 火紅的嫁衣襯著肌膚如雪舞痰。 梳的紋絲不亂的頭發(fā)上土榴,一...
    開封第一講書人閱讀 49,829評論 1 290
  • 那天,我揣著相機與錄音响牛,去河邊找鬼玷禽。 笑死,一個胖子當著我的面吹牛娃善,可吹牛的內(nèi)容都是我干的论衍。 我是一名探鬼主播瑞佩,決...
    沈念sama閱讀 38,979評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼聚磺,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了炬丸?” 一聲冷哼從身側響起瘫寝,我...
    開封第一講書人閱讀 37,722評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎稠炬,沒想到半個月后焕阿,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,189評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡首启,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,519評論 2 327
  • 正文 我和宋清朗相戀三年暮屡,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片毅桃。...
    茶點故事閱讀 38,654評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡褒纲,死狀恐怖准夷,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情莺掠,我是刑警寧澤衫嵌,帶...
    沈念sama閱讀 34,329評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站彻秆,受9級特大地震影響楔绞,放射性物質發(fā)生泄漏。R本人自食惡果不足惜唇兑,卻給世界環(huán)境...
    茶點故事閱讀 39,940評論 3 313
  • 文/蒙蒙 一酒朵、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧幔亥,春花似錦耻讽、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,762評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至香伴,卻和暖如春慰枕,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背即纲。 一陣腳步聲響...
    開封第一講書人閱讀 31,993評論 1 266
  • 我被黑心中介騙來泰國打工具帮, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人低斋。 一個月前我還...
    沈念sama閱讀 46,382評論 2 360
  • 正文 我出身青樓蜂厅,卻偏偏與公主長得像,于是被迫代替她去往敵國和親膊畴。 傳聞我的和親對象是個殘疾皇子掘猿,可洞房花燭夜當晚...
    茶點故事閱讀 43,543評論 2 349

推薦閱讀更多精彩內(nèi)容