聚類分析

文森特·梵高 :粉紅色的桃花樹

01、聚類分析

在沒有先驗(yàn)知識的情況下厘肮,對樣本按各自的特性來進(jìn)行合理的分類
聚類分析:不需要先知道所屬類別就可以實(shí)現(xiàn)按各自特性的分類

聚類分析有兩種主要計(jì)算方法后室,分別是凝聚層次聚類(Agglomerative hierarchical method)和K均值聚類(K-Means)
(1)層次聚類首先要定義樣本之間的距離關(guān)系雨让,距離較近的歸為一類嚷堡,較遠(yuǎn)的則屬于不同的類。
(2)K均值聚類不需要計(jì)算距離义图,但要求事先給出分類個(gè)數(shù)

02减俏、iris聚類分析

2.1、層次聚類

ris數(shù)據(jù)集包含5個(gè)方面的信息碱工,為了探索聚類分析娃承,所以采用前4個(gè)變量作為模型前期數(shù)據(jù),使用species作為聚類模型結(jié)果的驗(yàn)證怕篷。

數(shù)據(jù)集

(1)首先提取iris數(shù)據(jù)中的4個(gè)數(shù)值變量历筝,然后計(jì)算其歐氏距離矩陣。
(2)然后將矩陣?yán)L制熱圖廊谓,從圖中可以看到顏色越深表示樣本間距離越近·
從圖中可以看到顏色越深表示樣本間距離越近梳猪。大致上可以區(qū)分出三到四個(gè)區(qū)塊,其樣本之間比較接近蒸痹。

熱力圖
data<-iris[,-5]  #刪除第五行
dist.e <- dist(data,method='euclidean')  #變量間歐式距離的數(shù)據(jù)集
heatmap(as.matrix(dist.e),labRow = F, labCol = F)

使用hclust完成數(shù)據(jù)集的層次聚類春弥,plot函數(shù)可以查看聚類結(jié)果
使用cutree函數(shù)提取每個(gè)樣本所屬的類別

#--------------------------------------------->2、層次聚類模型
#建立聚類模型
model1<-hclust(dist.e,method='ward.D') #采用離差平方和法處理距離
plot(model1) #繪制聚類樹圖:沒什么用的結(jié)果
result<-cutree(model1,k=3) #使用cutree函數(shù)提取每個(gè)樣本所屬的類別

到此就完成了150個(gè)數(shù)據(jù)的類別劃分

層次聚類結(jié)果

可視化展現(xiàn)層次聚類結(jié)果
setose品種聚類很成功叠荠,但有一些virginica品種的花被錯(cuò)誤和virginica品種聚類到一起

#------------------------------------------------->3匿沛、層次聚類結(jié)果展示
#----------------------------------------------------->3.1、MDS降維
mds<-cmdscale(dist.e,k=2,eig=T)
x <- mds$points[,1]
y <- mds$points[,2]
#----------------------------------------------------->3.2榛鼎、聚類結(jié)果顯示
#以不同的的形狀表示原本的分類逃呼,用不同的顏色來表示聚類的結(jié)果
library(ggplot2)
p<-ggplot(data.frame(x,y),aes(x,y))
p+geom_point(size=3,alpha=0.8,aes(colour=factor(result),shape=iris$Species))
#setose品種聚類很成功,但有一些virginica品種的花被錯(cuò)誤和virginica品種聚類到一起
層次聚類結(jié)果

2.2者娱、K均值聚類

使用kmeans函數(shù)進(jìn)行K均值聚類

model2<-kmeans(data,centers=3,nstart=10)
model2$cluster    #model2$cluster可以用來提取每個(gè)樣本所屬的類別
data$type<-model2$cluster
data$id<-rownames(data)

centers參數(shù)用來設(shè)置分類個(gè)數(shù)蜘渣,
nstart參數(shù)用來設(shè)置取隨機(jī)初始中心的次數(shù),其默認(rèn)值為1肺然,但取較多的次數(shù)可以改善聚類效果
K均值聚類后,數(shù)據(jù)集的結(jié)果為:

K均值聚類

如果聚類正確的話腿准,圓形點(diǎn)對應(yīng)紅色际起;三角形對應(yīng)藍(lán)色拾碌;方框?qū)?yīng)綠色
K均值聚類setose品種聚類比較好,但有一些virginica品種的花被錯(cuò)誤和virginica品種聚類到一起

K均值聚類結(jié)果
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末街望,一起剝皮案震驚了整個(gè)濱河市校翔,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌灾前,老刑警劉巖防症,帶你破解...
    沈念sama閱讀 211,265評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異哎甲,居然都是意外死亡蔫敲,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評論 2 385
  • 文/潘曉璐 我一進(jìn)店門炭玫,熙熙樓的掌柜王于貴愁眉苦臉地迎上來奈嘿,“玉大人,你說我怎么就攤上這事吞加∪褂蹋” “怎么了?”我有些...
    開封第一講書人閱讀 156,852評論 0 347
  • 文/不壞的土叔 我叫張陵衔憨,是天一觀的道長叶圃。 經(jīng)常有香客問我,道長践图,這世上最難降的妖魔是什么掺冠? 我笑而不...
    開封第一講書人閱讀 56,408評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮平项,結(jié)果婚禮上赫舒,老公的妹妹穿的比我還像新娘。我一直安慰自己闽瓢,他們只是感情好接癌,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著扣讼,像睡著了一般缺猛。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上椭符,一...
    開封第一講書人閱讀 49,772評論 1 290
  • 那天荔燎,我揣著相機(jī)與錄音,去河邊找鬼销钝。 笑死有咨,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的蒸健。 我是一名探鬼主播座享,決...
    沈念sama閱讀 38,921評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼婉商,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了渣叛?” 一聲冷哼從身側(cè)響起丈秩,我...
    開封第一講書人閱讀 37,688評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎淳衙,沒想到半個(gè)月后蘑秽,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,130評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡箫攀,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評論 2 325
  • 正文 我和宋清朗相戀三年肠牲,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片匠童。...
    茶點(diǎn)故事閱讀 38,617評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡埂材,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出汤求,到底是詐尸還是另有隱情俏险,我是刑警寧澤,帶...
    沈念sama閱讀 34,276評論 4 329
  • 正文 年R本政府宣布扬绪,位于F島的核電站竖独,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏挤牛。R本人自食惡果不足惜莹痢,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望墓赴。 院中可真熱鬧竞膳,春花似錦、人聲如沸诫硕。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽章办。三九已至锉走,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間藕届,已是汗流浹背挪蹭。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留休偶,地道東北人梁厉。 一個(gè)月前我還...
    沈念sama閱讀 46,315評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像踏兜,于是被迫代替她去往敵國和親词顾。 傳聞我的和親對象是個(gè)殘疾皇子只冻,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評論 2 348

推薦閱讀更多精彩內(nèi)容