我們有時(shí)需要對一波總體樣本進(jìn)行分群减细,從而更好地了解群體之間的差異,通過聚類分析可以幫助我們解決這個(gè)問題赢笨。聚類分析在市場細(xì)分未蝌、人群細(xì)分等方面可以給我們很多啟發(fā)。
聚類分析在SPSS中分為系統(tǒng)聚類茧妒、K聚類及兩步聚類萧吠。
從區(qū)別上看,系統(tǒng)聚類桐筏、K聚類主要針對的是計(jì)量資料纸型,而兩步具備可同時(shí)對計(jì)量資料、計(jì)數(shù)資料進(jìn)行處理梅忌。
盡管在日常工作涉及的問卷中狰腌,計(jì)數(shù)資料涉及得較少,但從結(jié)果解讀方面牧氮,仍然是兩步聚類的解讀更為直觀琼腔。
以兩步聚類為例,我們來看一個(gè)案例:
例如:我們想針對一波美妝用戶群體進(jìn)行人群細(xì)分踱葛。通過兩步聚類丹莲,我們能夠從一波樣本中劃分不同的細(xì)分人群。
經(jīng)過本篇文章學(xué)習(xí)尸诽,您能夠?qū)柧頂?shù)據(jù)做以下分析:
①對總樣本進(jìn)行聚類
②篩選滿足不同條件的個(gè)案進(jìn)行進(jìn)一步分析(選擇個(gè)案)
兩步聚類
TIPS:在兩步聚類前甥材,一定要先清洗數(shù)據(jù),因跳轉(zhuǎn)題而出現(xiàn)的-3值性含,要全部清除掉之后再進(jìn)行聚類操作
1.分析-分類-兩步聚類
2.將可能影響到人群細(xì)分結(jié)果的變量選入分類變量中
連續(xù)變量在本次問卷題目中未涉及洲赵,因此不選
這一步的變量選擇在不確定的情況下,可能需要多次聚類驗(yàn)證,一定要選擇聚類效果最佳的那幾個(gè)變量
這里已經(jīng)根據(jù)最佳效果選擇好了相關(guān)變量
3.選項(xiàng)-操作默認(rèn)
若涉及到連續(xù)變量板鬓,在【要標(biāo)準(zhǔn)化的變量】中悲敷,將出現(xiàn)連續(xù)變量
這里未涉及連續(xù)變量,因此這里未顯示任何變量
4.輸出
勾選上方的圖表和表格俭令、創(chuàng)建聚類成員變量
5.確定
6.結(jié)果解讀
首先會出現(xiàn)一個(gè)簡單的圖后德,先來看一下這個(gè)圖
顯示我們輸入了8個(gè)相關(guān)變量,聚類為5類
我們本次預(yù)測質(zhì)量處在【良好】區(qū)間(這一步可多試幾個(gè)變量抄腔,選擇預(yù)測質(zhì)量最好的那次即可)
雙擊這張圖瓢湃,會出現(xiàn)2個(gè)視圖框
左側(cè)還是剛剛的圖,右側(cè)則出現(xiàn)了本次5種聚類在總樣本的占比情況
請注意赫蛇,現(xiàn)在左側(cè)視圖默認(rèn)在【模型概要】
我們現(xiàn)在選擇【聚類】绵患,會根據(jù)預(yù)測變量重要性出現(xiàn)一張漸變顏色的表格
逐一選擇5個(gè)聚類所在的列,右側(cè)選擇【單元分布】悟耘,會顯示聚類比較的結(jié)果
回到數(shù)據(jù)視圖中落蝙,原表格中最后一新增了一列TSC,顯示的數(shù)值則是根據(jù)本次聚類暂幼,每個(gè)人對應(yīng)在哪個(gè)分類的結(jié)果筏勒。
7.想要詳細(xì)了解各個(gè)細(xì)分人群在其他變量上的特征,我們根據(jù)【選擇個(gè)案】進(jìn)行具體分析
數(shù)據(jù)-選擇個(gè)案
如果條件滿足(先以第1類舉例)
TSC列中的數(shù)據(jù)為1旺嬉,我們會將第1類人群全部篩選出來管行,可以針對這個(gè)人群做更為具體的分析
點(diǎn)擊繼續(xù),點(diǎn)擊確定
分析具體的人群特點(diǎn)邪媳,可以通過描述【描述統(tǒng)計(jì)】得到
將這個(gè)過程重復(fù)5遍捐顷,我們就可以知道每個(gè)人群的人群特點(diǎn)分別是怎么樣的,再對這些細(xì)分人群進(jìn)行命名雨效,就實(shí)現(xiàn)了對一波樣本進(jìn)行人群細(xì)分的操作迅涮。