聚類分析的弱點:無論數(shù)據(jù)中是否真正存在不同的類別脂新,利用聚類分析總能得到將其拆分為若干類的結果挪捕。因此,進行結果的有效性驗證就變得非常關鍵争便。
結果驗證的方式:
(1)關鍵變量的分類別描述级零。如果在專業(yè)上比較重要的一些變量在各類別間的分布無明顯差異,則有理由懷疑聚類結果的有效性始花。
(2)各變量的類間比較妄讯。如果有較多變量在類間無差異,則有理由懷疑聚類效果不佳酷宵。
(3)將聚類結果作為因變量建立判別式亥贸,如果對各類別分別進行判別的回代正確率都非常高,那么就有較大把握認為這些類別是客觀存在且存在明顯特征差異的
(4)各個類別中案例數(shù)量盡量不要差距過大浇垦,否則有理由懷疑其“有用性”
(5)對同一數(shù)據(jù)集使用不同的聚類方法炕置,比較其結果,如果差異過大,則有理由懷疑聚類結果的“穩(wěn)定性”
(6)數(shù)據(jù)量過大時朴摊,可按照比例將其隨機分成兩個部分默垄,用同一種方法兩個部分進行處理,特征甚纲、數(shù)量差異過大口锭,則有理由懷疑其“可靠性”