【機器學(xué)習(xí)小筆記】kNN分類

kNN一句話概述

kNN算法:測量不同特征值之間的距離進行分類

舉個栗子:電影類型分類

一、問題

  • 問題描述:已知 6 部電影的打斗鏡頭、接吻鏡頭和電影類型,以及新電影的打斗鏡頭、接吻鏡頭蔓榄,預(yù)測新電影類型。

  • 數(shù)學(xué)表達:已知 6 個樣本的特征向量 ( x(1), x(2) ) 和類型(標記)默刚,以及新樣本的特征向量甥郑,預(yù)測新樣本類型。

  • 數(shù)學(xué)符號
    m 部電影 —— m 個樣本

    n 個特征向量 ( X(1), X(2), ... , X(n)) —— ( 打斗鏡頭荤西、接吻鏡頭澜搅、... )

    第 i 個樣本的特征向量為 ( x i(1), x i(2), ... , x i(n) )

    m 個樣本的特征向量為
    ( x 1(1), x 1(2), ... , x 1(n)
    x 2(1), x 2(2), ... , x 2(n)
    ... , ... , ... , ...
    x m(1), x m(2), ... , x m(n) )

    預(yù)測值 ( Y ) —— ( 電影類型 )

如下圖所示

編號/電影名稱 (m) 打斗鏡頭 (X(1)) 接吻鏡頭 (X(2)) 電影類型 (Y)
1 California Man 3 104 愛情片
2 omitted 2 100 愛情片
3 omitted 1 81 愛情片
4 omitted 101 10 動作片
5 omitted 99 5 動作片
6 omitted 88 2 動作片
7 omitted 18 90 ?

二、kNN算法步驟

1. 計算未知點與已知類別點的距離

  • 歐氏距離
    d= \sqrt [] { \sum_{k = 1}^{n} {(x_1^k - x_2^k)^2}}
  • 曼哈頓距離
    d= \sqrt [] { \sum_{k = 1}^{n} {|x_1^k- x_2^k|}}
  • 切比雪夫距離
    d= max(|x_1^1-x_2^1|,|x_1^2-x_2^2|,...,|x_1^n-x_2^n|)
  • 閔可夫斯基距離
    d= \sqrt [p] { \sum_{k = 1}^{n} {|x_1^k - x_2^k|^p}}
    p為 1 時邪锌,閔可夫斯基距離即曼哈頓距離
    p為 2 時勉躺,閔可夫斯基距離即歐氏距離
    p為 ∞ 時,閔可夫斯基距離即切比雪夫距離

按照歐式距離計算觅丰,樣本 1 與 新電影歐式距離計算:
d = \sqrt [] { (3 - 18)^2 + (104 - 90)^2}=20.5
如圖:

編號/電影名稱 (m) 與新電影的距離
1 California Man 20.5
2 omitted 18.7
3 omitted 19.2
4 omitted 115.3
5 omitted 117.4
6 omitted 118.9

2. 按照距離遞增次序排序

如圖:

編號/電影名稱 (m) 與新電影的距離
2 omitted 18.7
1 omitted 20.5
3 omitted 19.2
4 omitted 115.3
5 omitted 117.4
6 omitted 118.9

3. 選取與新電影距離最小的 k 個點

這里令 k 為 4饵溅,與新電影距離最近的 2 個點依次為第 2 個樣本、第 1 個樣本妇萄、第 3 個樣本和第 4 個樣本蜕企,其中愛情片的數(shù)量為 3,動作片的數(shù)量為 1冠句,則愛情片出現(xiàn)的頻率為:
p(love) = 3 / 4
動作片出現(xiàn)的頻率為:
p(action) = 1 / 4

注:例子的樣本數(shù)很小轻掩,為更好地說明問題,k值取得較大

4. 確定前k個點所在類別的出現(xiàn)頻率

p(love) > p(action)懦底,因此愛情片出現(xiàn)的頻率更高

5. 返回前k個點出現(xiàn)最高頻率的類別唇牧,即預(yù)測類別

新電影的類別為愛情片

  • 待更新

參考:《機器學(xué)習(xí)實戰(zhàn)》【美】Peter Harrington

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子丐重,更是在濱河造成了極大的恐慌腔召,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,590評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件弥臼,死亡現(xiàn)場離奇詭異宴咧,居然都是意外死亡根灯,警方通過查閱死者的電腦和手機径缅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,157評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來烙肺,“玉大人纳猪,你說我怎么就攤上這事√殷希” “怎么了氏堤?”我有些...
    開封第一講書人閱讀 169,301評論 0 362
  • 文/不壞的土叔 我叫張陵,是天一觀的道長搏明。 經(jīng)常有香客問我鼠锈,道長,這世上最難降的妖魔是什么星著? 我笑而不...
    開封第一講書人閱讀 60,078評論 1 300
  • 正文 為了忘掉前任购笆,我火速辦了婚禮,結(jié)果婚禮上虚循,老公的妹妹穿的比我還像新娘同欠。我一直安慰自己,他們只是感情好横缔,可當(dāng)我...
    茶點故事閱讀 69,082評論 6 398
  • 文/花漫 我一把揭開白布铺遂。 她就那樣靜靜地躺著,像睡著了一般茎刚。 火紅的嫁衣襯著肌膚如雪襟锐。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,682評論 1 312
  • 那天膛锭,我揣著相機與錄音粮坞,去河邊找鬼。 笑死泉沾,一個胖子當(dāng)著我的面吹牛捞蚂,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播跷究,決...
    沈念sama閱讀 41,155評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼姓迅,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起丁存,我...
    開封第一講書人閱讀 40,098評論 0 277
  • 序言:老撾萬榮一對情侶失蹤肩杈,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后解寝,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體扩然,經(jīng)...
    沈念sama閱讀 46,638評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,701評論 3 342
  • 正文 我和宋清朗相戀三年聋伦,在試婚紗的時候發(fā)現(xiàn)自己被綠了夫偶。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,852評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡觉增,死狀恐怖兵拢,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情逾礁,我是刑警寧澤说铃,帶...
    沈念sama閱讀 36,520評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站嘹履,受9級特大地震影響腻扇,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜砾嫉,卻給世界環(huán)境...
    茶點故事閱讀 42,181評論 3 335
  • 文/蒙蒙 一幼苛、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧焰枢,春花似錦蚓峦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,674評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至荐绝,卻和暖如春一汽,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背低滩。 一陣腳步聲響...
    開封第一講書人閱讀 33,788評論 1 274
  • 我被黑心中介騙來泰國打工召夹, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人恕沫。 一個月前我還...
    沈念sama閱讀 49,279評論 3 379
  • 正文 我出身青樓监憎,卻偏偏與公主長得像,于是被迫代替她去往敵國和親婶溯。 傳聞我的和親對象是個殘疾皇子鲸阔,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,851評論 2 361

推薦閱讀更多精彩內(nèi)容

  • 最近偷霉,從微博微信朋友圈悄悄流行了一個新詞:隱形貧困人口。什么是隱形貧困人口呢褐筛?它的意思就是指有些人看起來每...
    木頭人1997閱讀 870評論 0 3
  • 文/月照琴臺 每年五月类少,是芍藥的盛花期,因而她被稱作“五月花神”渔扎。北宋秦觀有詩曰:一夕輕雷落萬絲硫狞,霽光浮瓦碧參差。...
    月照琴臺閱讀 1,756評論 29 22
  • 最近幾天霧霾越來越嚴重了,多地PM2.5濃度超過500微克/立方米愧旦,出現(xiàn)“爆表”世剖,紅色預(yù)警啟動定罢,71個城市空氣質(zhì)量...
    沒心沒肺的貓閱讀 273評論 4 2
  • 她笤虫,靜悄悄地來過 如夢,白發(fā)蒼蒼顫巍巍背影 如幻祖凫,黃發(fā)垂髫眼如星稚氣 如泡琼蚯,一眼萬年做世故皺紋 如影,翩若驚鴻輕云...
    去年天氣閱讀 255評論 0 2