KNN與K-Means算法的區(qū)別

內(nèi)容參考：
Kmeans算法與KNN算法的區(qū)別
 kNN與kMeans聚類算法的區(qū)別

對(duì)比項(xiàng)	KNN	K-Means
目的	為了確定一個(gè)點(diǎn)的分類	為了將一系列點(diǎn)集分成K類
	分類算法	聚類算法
	監(jiān)督學(xué)習(xí)（有學(xué)習(xí)語料）	無監(jiān)督學(xué)習(xí)（沒有學(xué)習(xí)語料）
	沒有明顯的前期訓(xùn)練過程可柿，屬于memory-based learning	有明顯的前期訓(xùn)練過程
K的含義	“k”是用來計(jì)算的相鄰數(shù)據(jù)數(shù)筐喳。來了一個(gè)樣本x，要給它分類敢会，即求出它的y咬摇，就從數(shù)據(jù)集中辙诞，在x附近找離它最近的K個(gè)數(shù)據(jù)點(diǎn)，這K個(gè)數(shù)據(jù)點(diǎn)量淌，類別c占的個(gè)數(shù)最多骗村，就把x的label設(shè)為c	“k”是類的數(shù)目。K是人工固定好的數(shù)字呀枢，假設(shè)數(shù)據(jù)集合可以分為K個(gè)簇胚股，由于是依靠人工定好，需要一點(diǎn)先驗(yàn)知識(shí)
	K值確定后每次結(jié)果固定	K值確定后每次結(jié)果可能不同裙秋，從 n個(gè)數(shù)據(jù)對(duì)象任意選擇 k 個(gè)對(duì)象作為初始聚類中心琅拌，隨機(jī)性對(duì)結(jié)果影響較大
時(shí)間復(fù)雜度	O(n)	O(nkt)，t為迭代次數(shù)
常用距離	曼哈頓距離摘刑、歐式距離和閔可夫斯基距離	歐幾里得距離
相似點(diǎn)	都包含這樣的過程：給定一個(gè)點(diǎn)进宝，在數(shù)據(jù)集中找離它最近的點(diǎn)。即二者都用到了NN(Nears Neighbor)算法枷恕，一般用KD樹來實(shí)現(xiàn)NN即彪。

KNN-近鄰算法-分類算法

思想：在訓(xùn)練集中數(shù)據(jù)和標(biāo)簽已知的情況下，輸入測(cè)試數(shù)據(jù)，將測(cè)試數(shù)據(jù)的特征與訓(xùn)練集中對(duì)應(yīng)的特征進(jìn)行相互比較隶校，找到訓(xùn)練集中與之最為相似的前K個(gè)數(shù)據(jù)漏益，則該測(cè)試數(shù)據(jù)對(duì)應(yīng)的類別就是K個(gè)數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個(gè)分類。

算法的描述為：
1）計(jì)算測(cè)試數(shù)據(jù)與各個(gè)訓(xùn)練數(shù)據(jù)之間的距離（一般使用歐氏距離或曼哈頓距離）深胳；

image

2）按照距離的遞增關(guān)系進(jìn)行排序绰疤；
3）選取距離最小的K個(gè)點(diǎn)；
4）確定前K個(gè)點(diǎn)所在類別的出現(xiàn)頻率舞终；
5）返回前K個(gè)點(diǎn)中出現(xiàn)頻率最高的類別作為測(cè)試數(shù)據(jù)的預(yù)測(cè)分類轻庆。

K-Means聚類算法

把n個(gè)對(duì)象根據(jù)他們的屬性分為k個(gè)聚類以便使得所獲得的聚類滿足：同一聚類中的對(duì)象相似度較高；而不同聚類中的對(duì)象相似度較小

Kmeans算法的缺陷：

聚類中心的個(gè)數(shù)K 需要事先給定敛劝，但在實(shí)際中這個(gè) K 值的選定是非常難以估計(jì)的余爆，很多時(shí)候，事先并不知道給定的數(shù)據(jù)集應(yīng)該分成多少個(gè)類別才最合適
Kmeans需要人為地確定初始聚類中心夸盟，不同的初始聚類中心可能導(dǎo)致完全不同的聚類結(jié)果蛾方。（可以使用Kmeans++算法來解決）
針對(duì)上述第2個(gè)缺陷，可以使用Kmeans++算法來解決

最后編輯于：2018.07.18 19:20:37

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末上陕，一起剝皮案震驚了整個(gè)濱河市桩砰，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌释簿，老刑警劉巖亚隅，帶你破解...
沈念sama閱讀 222,946評(píng)論 6贊 518
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異庶溶，居然都是意外死亡煮纵，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,336評(píng)論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門偏螺，熙熙樓的掌柜王于貴愁眉苦臉地迎上來行疏，“玉大人，你說我怎么就攤上這事砖茸“妫” “怎么了？”我有些...
開封第一講書人閱讀 169,716評(píng)論 0贊 364
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵凉夯，是天一觀的道長货葬。經(jīng)常有香客問我，道長劲够，這世上最難降的妖魔是什么震桶？我笑而不...
開封第一講書人閱讀 60,222評(píng)論 1贊 300
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮征绎，結(jié)果婚禮上蹲姐，老公的妹妹穿的比我還像新娘磨取。我一直安慰自己，他們只是感情好柴墩，可當(dāng)我...
茶點(diǎn)故事閱讀 69,223評(píng)論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布忙厌。她就那樣靜靜地躺著，像睡著了一般江咳。火紅的嫁衣襯著肌膚如雪逢净。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 52,807評(píng)論 1贊 314
城市分裂傳說
那天歼指，我揣著相機(jī)與錄音爹土，去河邊找鬼。笑死踩身，一個(gè)胖子當(dāng)著我的面吹牛胀茵，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播挟阻，決...
沈念sama閱讀 41,235評(píng)論 3贊 424
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼琼娘，長吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了赁濒？” 一聲冷哼從身側(cè)響起轨奄，我...
開封第一講書人閱讀 40,189評(píng)論 0贊 277
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤孟害，失蹤者是張志新（化名）和其女友劉穎拒炎，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體挨务，經(jīng)...
沈念sama閱讀 46,712評(píng)論 1贊 320
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡击你，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,775評(píng)論 3贊 343
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了谎柄。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片丁侄。...
茶點(diǎn)故事閱讀 40,926評(píng)論 1贊 353
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖朝巫，靈堂內(nèi)的尸體忽然破棺而出鸿摇，到底是詐尸還是另有隱情，我是刑警寧澤劈猿，帶...
沈念sama閱讀 36,580評(píng)論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布拙吉，位于F島的核電站，受9級(jí)特大地震影響揪荣，放射性物質(zhì)發(fā)生泄漏筷黔。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 42,259評(píng)論 3贊 336
男人毒藥：我在死后第九天來索命
文/蒙蒙一仗颈、第九天我趴在偏房一處隱蔽的房頂上張望佛舱。院中可真熱鬧，春花似錦、人聲如沸请祖。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,750評(píng)論 0贊 25
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽肆捕。三九已至陌粹，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間福压，已是汗流浹背掏秩。一陣腳步聲響...
開封第一講書人閱讀 33,867評(píng)論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留荆姆，地道東北人蒙幻。一個(gè)月前我還...
沈念sama閱讀 49,368評(píng)論 3贊 379
代替公主和親
正文我出身青樓，卻偏偏與公主長得像胆筒，于是被迫代替她去往敵國和親邮破。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,930評(píng)論 2贊 361

KNN與K-Means算法的區(qū)別

KNN-近鄰算法-分類算法

K-Means聚類算法

推薦閱讀更多精彩內(nèi)容