機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)(五):KNN

K近鄰(KNN)算法R語(yǔ)言實(shí)踐


第一步:數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集

index <-sample(1:nrow(iris), 100)iris.train <-iris[index, ]iris.test <-iris[-index, ]


第二步:加載能夠做k近鄰的class包

library(class)

## ?Warning: package 'class'was built under R version 3.1.3


第三步:利用kNN算法對(duì)測(cè)試集進(jìn)行分類

result.KNN<-knn(train=subset(iris.train,select=-Species),test=subset(iris.test,select=-Species), cl=iris.train$Species)


第四步:生成結(jié)果集的混淆矩陣

table(result.KNN, iris.test$Species)

result.KNN/? setosa? versicolor? virginica

setosa? ? ? ? 21? ? ? 0? ? ? ? ? ? 0

versicolor? ? 0? ? ? ? 11? ? ? ? ? 1

virginica? ? 0? ? ? ? 1? ? ? ? ? ? 16


kNN算法原理

1冰啃、K最近鄰(k-NearestNeighbor常拓,KNN)分類算法香嗓,是一個(gè)理論上比較成熟的方法舌厨,也是最簡(jiǎn)單的機(jī)器學(xué)習(xí)算法之一橄务。該方法的思路是:如果一個(gè)樣本在特征空間中的k個(gè)最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個(gè)類別得院,則該樣本也屬于這個(gè)類別拜银。

2、KNN算法中钠至,所選擇的鄰居都是已經(jīng)正確分類的對(duì)象。該方法在定類決策上只依據(jù)最鄰近的一個(gè)或者幾個(gè)樣本的類別來(lái)決定待分樣本所屬的類別胎源。KNN方法雖然從原理上也依賴于極限定理棉钧,但在類別決策時(shí),只與極少量的相鄰樣本有關(guān)涕蚤。由于KNN方法主要靠周圍有限的鄰近的樣本宪卿,而不是靠判別類域的方法來(lái)確定所屬類別的,因此對(duì)于類域的交叉或重疊較多的待分樣本集來(lái)說(shuō)万栅,KNN方法較其他方法更為適合佑钾。

3、KNN算法不僅可以用于分類烦粒,還可以用于回歸休溶。通過(guò)找出一個(gè)樣本的k個(gè)最近鄰居,將這些鄰居的屬性的平均值賦給該樣本扰她,就可以得到該樣本的屬性兽掰。更有用的方法是將不同距離的鄰居對(duì)該樣本產(chǎn)生的影響給予不同的權(quán)值(weight),如權(quán)值與距離成正比徒役。


參考文獻(xiàn):

本文轉(zhuǎn)載自 ? ?http://www.360doc.com/userhome.aspx?userid=26290960&cid=10

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末孽尽,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子忧勿,更是在濱河造成了極大的恐慌杉女,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,252評(píng)論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件鸳吸,死亡現(xiàn)場(chǎng)離奇詭異熏挎,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)晌砾,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén)坎拐,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人贡羔,你說(shuō)我怎么就攤上這事廉白「龀酰” “怎么了乖寒?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,814評(píng)論 0 361
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)院溺。 經(jīng)常有香客問(wèn)我楣嘁,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,869評(píng)論 1 299
  • 正文 為了忘掉前任逐虚,我火速辦了婚禮聋溜,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘叭爱。我一直安慰自己撮躁,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,888評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布买雾。 她就那樣靜靜地躺著把曼,像睡著了一般。 火紅的嫁衣襯著肌膚如雪漓穿。 梳的紋絲不亂的頭發(fā)上嗤军,一...
    開(kāi)封第一講書(shū)人閱讀 52,475評(píng)論 1 312
  • 那天,我揣著相機(jī)與錄音晃危,去河邊找鬼叙赚。 笑死,一個(gè)胖子當(dāng)著我的面吹牛僚饭,可吹牛的內(nèi)容都是我干的震叮。 我是一名探鬼主播,決...
    沈念sama閱讀 41,010評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼浪慌,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼冤荆!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起权纤,我...
    開(kāi)封第一講書(shū)人閱讀 39,924評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤钓简,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后汹想,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體外邓,經(jīng)...
    沈念sama閱讀 46,469評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,552評(píng)論 3 342
  • 正文 我和宋清朗相戀三年古掏,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了损话。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,680評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡槽唾,死狀恐怖丧枪,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情庞萍,我是刑警寧澤拧烦,帶...
    沈念sama閱讀 36,362評(píng)論 5 351
  • 正文 年R本政府宣布,位于F島的核電站钝计,受9級(jí)特大地震影響恋博,放射性物質(zhì)發(fā)生泄漏齐佳。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,037評(píng)論 3 335
  • 文/蒙蒙 一债沮、第九天 我趴在偏房一處隱蔽的房頂上張望炼吴。 院中可真熱鬧,春花似錦疫衩、人聲如沸硅蹦。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,519評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)提针。三九已至,卻和暖如春曹傀,著一層夾襖步出監(jiān)牢的瞬間辐脖,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,621評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工皆愉, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留嗜价,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 49,099評(píng)論 3 378
  • 正文 我出身青樓幕庐,卻偏偏與公主長(zhǎng)得像久锥,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子异剥,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,691評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容

  • kNN算法原理 1瑟由、K最近鄰(k-NearestNeighbor,KNN)分類算法冤寿,是一個(gè)理論上比較成熟的方法歹苦,也...
    雨一流閱讀 24,950評(píng)論 0 8
  • 前言 學(xué)習(xí)數(shù)據(jù)挖掘已經(jīng)有一段時(shí)間了,相關(guān)的文章和書(shū)也看了一些督怜,感覺(jué)學(xué)習(xí)這個(gè)的關(guān)鍵還是離不開(kāi)其中形形色色的算法殴瘦。作為...
    謙嘯閱讀 5,497評(píng)論 2 21
  • 一.樸素貝葉斯 1.分類理論 樸素貝葉斯是一種基于貝葉斯定理和特征條件獨(dú)立性假設(shè)的多分類的機(jī)器學(xué)習(xí)方法,所...
    wlj1107閱讀 3,096評(píng)論 0 5
  • 偶然之間看到号杠,很多R包中都有knn算法的應(yīng)用蚪腋,他們有什么不同之處嗎?到底應(yīng)該選擇哪個(gè)包來(lái)實(shí)現(xiàn)knn呢姨蟋?為了解決這些...
    奔跑的蜈蚣閱讀 10,803評(píng)論 2 6
  • ——20日夜戀纏綿秋雨中杭城的霓虹 秋雨大街小巷里纏綿屉凯, 你卻穿梭搖曳, 忘記了整個(gè)夜晚眼溶, 于是凄楚的街耀眼的冷艷...
    青荷小泉閱讀 134評(píng)論 0 0