2020-07-28

均值漂移非常類似于 KMeans 算法,除了一個很重要的因素踱侣,你不需要指定分組的數(shù)量粪小。均質漂亮算法自己尋找簇。出于這個原因抡句,它比起 KMeans探膊,更加是一種“非監(jiān)督”的機器學習的算法。

均值漂移的方式就是遍歷每個特征集(圖上的數(shù)據(jù)點)待榔,并且執(zhí)行登山的操作逞壁。登山就像它的名字,思想是持續(xù)底層,或者向上走腌闯,直到到達了頂部绳瘟。我們不確定只有一個局部最大值。我們可能擁有一個姿骏,也可能擁有是個糖声。這里我們的“山”就是給定半徑內的特征集或數(shù)據(jù)點數(shù)量。半徑也叫作貸款工腋,整個窗口就是你的核。窗口中的數(shù)據(jù)越多畅卓,就越好擅腰。一旦我們不再執(zhí)行另一個步驟,來降低半徑內的特征集或者數(shù)據(jù)點的數(shù)量時翁潘,我們就選取該區(qū)域內所有數(shù)據(jù)的均值趁冈,然后就有了簇的中心。我們從每個數(shù)據(jù)點開始這樣做拜马。許多數(shù)據(jù)點都會產(chǎn)生相同的簇中心渗勘,這應該是預料中的,但是其他數(shù)據(jù)點也可能有完全不同的簇中心俩莽。

但是旺坠,你應該開始認識到這個操作的主要弊端:規(guī)模。規(guī)陌绯看似是一個永久的問題取刃。所以我們從每個數(shù)據(jù)點開始運行這個優(yōu)化算法,這很糟糕出刷,我們可以使用一些方法來加速這個過程璧疗,但是無論怎么樣,這個算法仍然開銷很大馁龟。

雖然這個方法是層次聚類方法崩侠,你的核可以是扁平的,或者高斯核坷檩。要記住這個核就是你的窗口却音,在尋找均值時,我們可以讓每個特征集擁有相同權重(扁平核)矢炼,或者通過核中心的接近性來分配權重(高斯核)僧家。

均值漂移用于什么呢?核之前提到的聚類相比裸删,均值漂移在圖像分析的跟蹤和平滑中很熱門“斯埃現(xiàn)在,我們打算僅僅專注于我們的特征集聚類。

現(xiàn)在為止肌稻,我們涉及了使用 Sklearn 和 Matplotlib 可視化的基礎清蚀,以及分類器的屬性。所以我直接貼出了代碼:

import numpy as np
from sklearn.cluster import MeanShift
from sklearn.datasets.samples_generator import make_blobs
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from matplotlib import style
style.use("ggplot")

centers = [[1,1,1],[5,5,5],[3,10,10]]

X, _ = make_blobs(n_samples = 100, centers = centers, cluster_std = 1.5)

ms = MeanShift()
ms.fit(X)
labels = ms.labels_
cluster_centers = ms.cluster_centers_

print(cluster_centers)
n_clusters_ = len(np.unique(labels))
print("Number of estimated clusters:", n_clusters_)

colors = 10*['r','g','b','c','k','y','m']
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')

for i in range(len(X)):
    ax.scatter(X[i][0], X[i][1], X[i][2], c=colors[labels[i]], marker='o')

ax.scatter(cluster_centers[:,0],cluster_centers[:,1],cluster_centers[:,2],
            marker="x",color='k', s=150, linewidths = 5, zorder=10)

plt.show()

控制臺輸出:

[[  1.26113946   1.24675516   1.04657994]
 [  4.87468691   4.88157787   5.15456168]
 [  2.77026724  10.3096062   10.40855045]]
Number of estimated clusters: 3
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末爹谭,一起剝皮案震驚了整個濱河市枷邪,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌诺凡,老刑警劉巖东揣,帶你破解...
    沈念sama閱讀 212,718評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異腹泌,居然都是意外死亡嘶卧,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,683評論 3 385
  • 文/潘曉璐 我一進店門凉袱,熙熙樓的掌柜王于貴愁眉苦臉地迎上來芥吟,“玉大人,你說我怎么就攤上這事专甩≈油遥” “怎么了?”我有些...
    開封第一講書人閱讀 158,207評論 0 348
  • 文/不壞的土叔 我叫張陵涤躲,是天一觀的道長棺耍。 經(jīng)常有香客問我,道長种樱,這世上最難降的妖魔是什么烈掠? 我笑而不...
    開封第一講書人閱讀 56,755評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮缸托,結果婚禮上左敌,老公的妹妹穿的比我還像新娘。我一直安慰自己俐镐,他們只是感情好矫限,可當我...
    茶點故事閱讀 65,862評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著佩抹,像睡著了一般叼风。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上棍苹,一...
    開封第一講書人閱讀 50,050評論 1 291
  • 那天无宿,我揣著相機與錄音,去河邊找鬼枢里。 笑死孽鸡,一個胖子當著我的面吹牛蹂午,可吹牛的內容都是我干的。 我是一名探鬼主播彬碱,決...
    沈念sama閱讀 39,136評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼豆胸,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了巷疼?” 一聲冷哼從身側響起晚胡,我...
    開封第一講書人閱讀 37,882評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎嚼沿,沒想到半個月后估盘,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,330評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡骡尽,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,651評論 2 327
  • 正文 我和宋清朗相戀三年遣妥,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片爆阶。...
    茶點故事閱讀 38,789評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡燥透,死狀恐怖沙咏,靈堂內的尸體忽然破棺而出辨图,到底是詐尸還是另有隱情,我是刑警寧澤肢藐,帶...
    沈念sama閱讀 34,477評論 4 333
  • 正文 年R本政府宣布故河,位于F島的核電站,受9級特大地震影響吆豹,放射性物質發(fā)生泄漏鱼的。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,135評論 3 317
  • 文/蒙蒙 一痘煤、第九天 我趴在偏房一處隱蔽的房頂上張望凑阶。 院中可真熱鬧,春花似錦衷快、人聲如沸宙橱。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,864評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽师郑。三九已至,卻和暖如春调窍,著一層夾襖步出監(jiān)牢的瞬間宝冕,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,099評論 1 267
  • 我被黑心中介騙來泰國打工邓萨, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留地梨,地道東北人菊卷。 一個月前我還...
    沈念sama閱讀 46,598評論 2 362
  • 正文 我出身青樓,卻偏偏與公主長得像湿刽,于是被迫代替她去往敵國和親的烁。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,697評論 2 351