3個聚類指標

使用聚類算法后顷编,比如k-means,要評價聚類的效果如何哀军,可以用以下指標。
評價聚類模型好的標準:同一簇類的數據集盡可能密集打却,不同簇類的數據集盡可能遠離杉适。

(1)輪廓系數

1.計算當前簇類凝聚度:當前簇類的樣本i到其簇類內所有其他樣本的距離的平均值,記為a柳击。
2.計算當前簇類與鄰居簇類的分離度:樣本i到鄰居簇類(最近那個)內所有樣本的距離的平均值猿推,記為b。由于不知道哪一個簇類是鄰居簇類捌肴,所以要遍歷其他各個簇類蹬叭,選擇距離平均值最小的簇類作為鄰居簇類。
3.對于樣本i状知,計算輪廓系數:s=\frac{b-a}{max(a,b)}
4.計算當前簇類內的所有樣本的輪廓系數的平均值秽五,作為當前簇類的輪廓系數。
值會在(-1饥悴,1)坦喘,不難發(fā)現若s小于0,說明分離度b小于聚合度a铺坞,表示聚類效果不好起宽。我們希望分離度要大洲胖,聚合度要小济榨,即b>>a,這樣聚類效果比較好绿映。
代碼:

from sklearn import metrics
from sklearn.cluster import KMeans
from sklearn import datasets
# 生成數據集
dataset = datasets.load_iris()
X = dataset.data
y = dataset.target
# 構建K均值聚類模型
kmeans_model = KMeans(n_clusters=3, random_state=1).fit(X)
labels = kmeans_model.labels_
# 輪廓系數
metrics.silhouette_score(X, labels, metric='euclidean')

(2) DB指數(Davies-Bouldin Index)

1.計算各個簇類的凝聚度:

各個簇類的凝聚度
其中|C|表示簇類C的個數擒滑,dist(·,·)計算兩個樣本之間的距離。
2.計算各個簇類之間的分離度:
各個簇類之間的分離度

其中,是簇類中心叉弦。
3.計算DB指數:
DB指數

DB指數越小說明聚類效果越好丐一。DB指數的計算比輪廓系數簡單;DB指數的計算只需要知道數據集的數量和特征淹冰。

(3)CH指數

直接上代碼:

from sklearn import metrics
from sklearn.cluster import KMeans

kmeans_model = KMeans(n_clusters=3, random_state=1).fit(X)
labels = kmeans_model.labels_
metrics.calinski_harabaz_score(X, labels)

當簇類密集且簇間分離較好時库车,Caliniski-Harabaz分數越高,聚類性能越好樱拴。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末柠衍,一起剝皮案震驚了整個濱河市洋满,隨后出現的幾起案子,更是在濱河造成了極大的恐慌珍坊,老刑警劉巖牺勾,帶你破解...
    沈念sama閱讀 212,222評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異阵漏,居然都是意外死亡驻民,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 90,455評論 3 385
  • 文/潘曉璐 我一進店門履怯,熙熙樓的掌柜王于貴愁眉苦臉地迎上來回还,“玉大人,你說我怎么就攤上這事虑乖∨城鳎” “怎么了?”我有些...
    開封第一講書人閱讀 157,720評論 0 348
  • 文/不壞的土叔 我叫張陵疹味,是天一觀的道長仅叫。 經常有香客問我,道長糙捺,這世上最難降的妖魔是什么诫咱? 我笑而不...
    開封第一講書人閱讀 56,568評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮洪灯,結果婚禮上坎缭,老公的妹妹穿的比我還像新娘。我一直安慰自己签钩,他們只是感情好掏呼,可當我...
    茶點故事閱讀 65,696評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著铅檩,像睡著了一般憎夷。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上昧旨,一...
    開封第一講書人閱讀 49,879評論 1 290
  • 那天拾给,我揣著相機與錄音,去河邊找鬼兔沃。 笑死蒋得,一個胖子當著我的面吹牛,可吹牛的內容都是我干的乒疏。 我是一名探鬼主播额衙,決...
    沈念sama閱讀 39,028評論 3 409
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了窍侧?” 一聲冷哼從身側響起追驴,我...
    開封第一講書人閱讀 37,773評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎疏之,沒想到半個月后脑豹,有當地人在樹林里發(fā)現了一具尸體研叫,經...
    沈念sama閱讀 44,220評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,550評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了赖晶。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片矫渔。...
    茶點故事閱讀 38,697評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡啃奴,死狀恐怖腊满,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情拯爽,我是刑警寧澤索抓,帶...
    沈念sama閱讀 34,360評論 4 332
  • 正文 年R本政府宣布,位于F島的核電站毯炮,受9級特大地震影響逼肯,放射性物質發(fā)生泄漏。R本人自食惡果不足惜桃煎,卻給世界環(huán)境...
    茶點故事閱讀 40,002評論 3 315
  • 文/蒙蒙 一篮幢、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧为迈,春花似錦三椿、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,782評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至耿战,卻和暖如春蛋叼,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背昆箕。 一陣腳步聲響...
    開封第一講書人閱讀 32,010評論 1 266
  • 我被黑心中介騙來泰國打工鸦列, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留租冠,地道東北人鹏倘。 一個月前我還...
    沈念sama閱讀 46,433評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像顽爹,于是被迫代替她去往敵國和親纤泵。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,587評論 2 350

推薦閱讀更多精彩內容

  • 聚類算法 前面介紹的集中算法都是屬于有監(jiān)督機器學習方法,這章和前面不同捏题,介紹無監(jiān)督學習算法玻褪,也就是聚類算法。在無監(jiān)...
    飄涯閱讀 41,286評論 3 52
  • 1. 章節(jié)主要內容 “聚類”(clustering)算法是“無監(jiān)督學習”算法中研究最多公荧、應用最廣的算法带射,它試圖將數...
    閃電隨筆閱讀 5,025評論 1 24
  • 兩個小時窟社,挨著床沿坐在地上看完從前日記。種種寒微绪钥,如今想來幾乎要落淚灿里。
    周靜不咸閱讀 151評論 0 1
  • 問吾儕昔日如何? 朝也豪歌程腹, 暮也豪歌匣吊。 問吾儕今日如何? 朝也蹉跎寸潦, 暮也蹉跎色鸳。 昔日也十五六束發(fā)少年英氣勃 今...
    清水一滴閱讀 393評論 0 1