K-均值算法概述:
首先汞窗,我們有一個(gè)無(wú)標(biāo)簽數(shù)據(jù)集患久,我們想要把它們分成兩個(gè)類另萤,然后我們使用k-均值算法來(lái)做:
1、我們選取兩個(gè)點(diǎn)巫员,稱為聚類中心(cluster centroids):
2庶香、遍歷所有的點(diǎn),更靠近哪個(gè)聚類中心简识,就把它歸為那一個(gè)類中:
3赶掖、移動(dòng)聚類中心到它們自己類的均值處:
4、然后我們繼續(xù)第2步七扰,遍歷所有的點(diǎn)奢赂,看它離哪個(gè)聚類中心更近就把它歸到那一類中:
5、繼續(xù)第3步颈走,移動(dòng)聚類中心到它們自己類的均值處:
6膳灶、繼續(xù)第2步:
7、繼續(xù)第3步:
8立由、繼續(xù)第2步:
如此反復(fù)轧钓,當(dāng)點(diǎn)的顏色不再變化司致,我們便認(rèn)為K均值方法已經(jīng)收斂了。
輸入:
- K(聚類數(shù))
- 訓(xùn)練集{x(1),x(2),......,x(m)}
對(duì)于沒(méi)有明顯區(qū)分的數(shù)據(jù)也可以很好的分開(kāi):