聚類分析
單擊→聚類分析
(歡迎關(guān)注微信公眾號(hào):spss學(xué)習(xí)樂園)
聚類分析
聚類分析:研究如何將樣品或變量進(jìn)行分類的一種方法弟翘,通俗地說粘衬,即“物以類聚”婉宰。
從分類目的的角度新娜,聚類分析可分為R型聚類和Q型聚類。R型聚類慧耍,即指標(biāo)聚類(變量聚類)身辨,將原先數(shù)個(gè)指標(biāo)轉(zhuǎn)化為幾類有代表性的新指標(biāo)(原理為降維)。Q型聚類芍碧,即樣品聚類煌珊,將數(shù)據(jù)的樣本觀測值分為幾類。
聚類分析的優(yōu)缺點(diǎn)
優(yōu)點(diǎn):聚類分析模型的優(yōu)點(diǎn)就是直觀,結(jié)論形式簡明泌豆。
缺點(diǎn):在樣本量較大時(shí),要獲得聚類結(jié)論有一定困難定庵。由于相似系數(shù)是根據(jù)被試的反映來建立反映被試間內(nèi)在聯(lián)系的指標(biāo),而實(shí)踐中有時(shí)盡管從被試反映所得出的數(shù)據(jù)中發(fā)現(xiàn)他們之間有緊密的關(guān)系,但事物之間卻無任何內(nèi)在聯(lián)系,此時(shí),如果根據(jù)距離或相似系數(shù)得出聚類分析的結(jié)果顯然是不適當(dāng)?shù)?但是,聚類分析模型本身卻無法識(shí)別這類錯(cuò)誤。
常見的聚類方法
本節(jié)主要介紹系統(tǒng)聚類分析方法踪危,其中蔬浙,系統(tǒng)聚類法有最短距離法、?最長距離法贞远、中間距離法畴博、重心法(僅用于樣品聚類)、類平均法(僅用于樣品聚類)蓝仲、離差平方和法(即Ward法)俱病,可變類平均法官疲、可變法。
其中亮隙,最短距離法不適于過于密集的群體途凫;
最長距離法易受異常值的影響;
重心法對(duì)于異常值的處理更穩(wěn)皆圩帷颖榜;
Ward方法適用于多種場合妖泄,但對(duì)異常值較敏感递递;
系統(tǒng)聚類分析基本原理
先將n個(gè)樣品看成n類(即一類包含一個(gè)樣品),然后將性質(zhì)最接近的兩類合并成一個(gè)新類充活,這樣我們就得到n-1類硼砰,再從中找出最接近的兩類且蓬,繼續(xù)和并為n-2類,依次類推题翰,直到所有的樣品合并為預(yù)測的類數(shù)或一類時(shí)結(jié)束恶阴。
為了更清晰的理解其原理,我們以最短距離法為例豹障,如下所示↓↓
聚類分析注意事項(xiàng)
①聚類分析常用于探索性分析冯事,聚類分析需要使用多種方法,綜合比較出較好的結(jié)論血公。
②應(yīng)剔除無效變量(變量值變化很嘘墙觥)、缺失值過多的變量累魔。
③聚類后的變量摔笤,組類間的差異較小,組間的差異較大垦写。
01
案例分析
現(xiàn)對(duì)10名女排運(yùn)動(dòng)員的七項(xiàng)運(yùn)動(dòng)指標(biāo)測定吕世,X1(800m跑)、X2(立定三級(jí)跳遠(yuǎn))梯投、X3(仰臥起坐)命辖、X4(3m折返跑)、X5(思維靈敏性)分蓖、X6(運(yùn)動(dòng)知覺)吮龄、X7(適競感)。現(xiàn)將這10名運(yùn)動(dòng)員歸類(數(shù)據(jù)來源:醫(yī)學(xué)統(tǒng)計(jì)學(xué)咆疗,第四版,點(diǎn)擊閱讀原文獲取數(shù)據(jù)+密碼:r02h)
數(shù)據(jù)視圖
變量視圖
02
手把手教你
以系統(tǒng)聚類方法為例
【一】單擊“分析”“分類”“系統(tǒng)聚類”
【二】彈出如下所示的對(duì)話框母债,將待分析的變量選入右側(cè)變量框中
【三】單擊“繪圖”午磁,勾選“系譜圖”尝抖,圖的方向也可以選擇(本例選擇“水平”)
【四】單擊“方法”,SPSS中提供了七種系統(tǒng)聚類的計(jì)算方法迅皇,本次采用系統(tǒng)默認(rèn)的方法“組之間的鏈接”
03
結(jié)果分析
①
個(gè)案處理摘要昧辽,了解數(shù)據(jù)情況
②
從結(jié)果來看,運(yùn)動(dòng)員“2”和“3”聚為一類登颓,運(yùn)動(dòng)員“9”和“10”聚為一類搅荞,運(yùn)動(dòng)員“6”和“7”聚為一類,運(yùn)動(dòng)員“4”和“5”聚為一類框咙,下面的依次類推咕痛;
下一階段,“2”喇嘱、“3”與“4”茉贡、“5”聚為一類,后面結(jié)果依次類推者铜。具體情況可以參考系譜圖腔丧,更直觀易懂。
③