機(jī)器學(xué)習(xí)入坑指南（六）：K 近鄰算法

一、算法簡介

K 近鄰 (KNN享怀，K Nearest Neighbours) 是一種分類算法羽峰。

算法的思想為：要判斷一個(gè)東西屬于哪一類，看看跟它特征最近似的 K 個(gè)東西都屬于什么添瓷，如果這 K 個(gè)東西屬于 A 類的最多梅屉，那我們就認(rèn)為未知的那個(gè)東西也是 A 類的。

舉個(gè)栗子鳞贷，小明拿到一個(gè)水果坯汤，皮是黃色的，可以剝開搀愧，甜甜的軟軟的惰聂，這時(shí)候麻麻買回來了一串香蕉一袋橘子疆偿，小明發(fā)現(xiàn)香蕉跟你拿的這個(gè)東西好像哦，于是他認(rèn)定自己拿的這個(gè)水果也是香蕉搓幌。這是不是有點(diǎn)像小朋友認(rèn)識(shí)東西的過程呢杆故？

與之前學(xué)習(xí)的算法不同的是，KNN 屬于“非參數(shù)方法”溉愁。也就是說处铛，我們沒有假設(shè)樣本符合什么樣的分布情況，沒有把分類問題轉(zhuǎn)換為求解參數(shù)的過程拐揭。

image

如圖撤蟆，假設(shè)輸入特征是二元的，我們把樣本數(shù)據(jù)的特征 $(x_1,x_2)$ 作為二維平面的點(diǎn)坐標(biāo)投队，并用不同形狀表示樣本的類。那么想要判斷點(diǎn)屬于哪一類爵川，只要把它也放在平面中敷鸦，觀察離它最近的 K（圖中 K = 5）個(gè)點(diǎn)，發(fā)現(xiàn)三角形最多寝贡，于是需要預(yù)測(cè)的點(diǎn)就可以被認(rèn)為屬于三角形所代表的類扒披。

我們通常使用“歐氏距離”來表示兩數(shù)據(jù)點(diǎn)的相近程度。當(dāng)輸入特征為多元時(shí)圃泡，假設(shè)平面中有兩點(diǎn) $x = (x_1,x_2,...x_n)$ 和 $y = (y_1,y_2,...y_n)$ 碟案，其距離為

$distance = \sqrt{\sum_i^n(x_i - y_i)^2}$

注意：

使用歐氏距離存在一個(gè)問題，如果不同特征的值不在一個(gè)數(shù)量級(jí)上颇蜡，那么數(shù)量級(jí)大的特征將會(huì)對(duì)距離產(chǎn)生決定性影響价说，所以，我們需要先進(jìn)行「數(shù)據(jù)預(yù)處理」风秤，對(duì)特征進(jìn)行縮放鳖目。

二、Python 代碼實(shí)現(xiàn)

示例數(shù)據(jù)地址：GitHub - Avik-Jain/100-Days-Of-ML-Code/datasets

1 數(shù)據(jù)預(yù)處理

# 導(dǎo)入庫
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
# 導(dǎo)入數(shù)據(jù)
dataset = pd.read_csv('Social_Network_Ads.csv')
X = dataset.iloc[:, [2, 3]].values
y = dataset.iloc[:, 4].values
# 分割
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)
# 特征縮放
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

2 使用訓(xùn)練集擬合算法

from sklearn.neighbors import KNeighborsClassifier
classifier = KNeighborsClassifier(n_neighbors = 5, metric = 'minkowski', p = 2)
classifier.fit(X_train, y_train)

3 預(yù)測(cè)與評(píng)價(jià)

# 使用測(cè)試集預(yù)測(cè)
y_pred = classifier.predict(X_test)
# 生成混淆矩陣
from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_test, y_pred)

歡迎關(guān)注 Evan 的博客

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末缤弦，一起剝皮案震驚了整個(gè)濱河市领迈，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌碍沐，老刑警劉巖狸捅，帶你破解...
沈念sama閱讀 222,729評(píng)論 6贊 517
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異累提，居然都是意外死亡尘喝，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,226評(píng)論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門斋陪，熙熙樓的掌柜王于貴愁眉苦臉地迎上來瞧省，“玉大人扯夭，你說我怎么就攤上這事“柏遥” “怎么了交洗？”我有些...
開封第一講書人閱讀 169,461評(píng)論 0贊 362
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長橡淑。經(jīng)常有香客問我构拳，道長，這世上最難降的妖魔是什么梁棠？我笑而不...
開封第一講書人閱讀 60,135評(píng)論 1贊 300
?港島之戀（遺憾婚禮）
正文為了忘掉前任置森，我火速辦了婚禮，結(jié)果婚禮上符糊，老公的妹妹穿的比我還像新娘凫海。我一直安慰自己，他們只是感情好男娄，可當(dāng)我...
茶點(diǎn)故事閱讀 69,130評(píng)論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布行贪。她就那樣靜靜地躺著，像睡著了一般模闲。火紅的嫁衣襯著肌膚如雪建瘫。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 52,736評(píng)論 1贊 312
城市分裂傳說
那天尸折，我揣著相機(jī)與錄音啰脚，去河邊找鬼。笑死实夹，一個(gè)胖子當(dāng)著我的面吹牛橄浓，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播亮航，決...
沈念sama閱讀 41,179評(píng)論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼贮配，長吁一口氣：“原來是場噩夢(mèng)啊……” “哼！你這毒婦竟也來了塞赂？” 一聲冷哼從身側(cè)響起泪勒，我...
開封第一講書人閱讀 40,124評(píng)論 0贊 277
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎宴猾，沒想到半個(gè)月后圆存，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 46,657評(píng)論 1贊 320
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡仇哆，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,723評(píng)論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年沦辙，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片讹剔。...
茶點(diǎn)故事閱讀 40,872評(píng)論 1贊 353
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡油讯，死狀恐怖详民，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情陌兑，我是刑警寧澤沈跨，帶...
沈念sama閱讀 36,533評(píng)論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站兔综，受9級(jí)特大地震影響饿凛，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜软驰，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 42,213評(píng)論 3贊 336
男人毒藥：我在死后第九天來索命
文/蒙蒙一涧窒、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧锭亏，春花似錦纠吴、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,700評(píng)論 0贊 25
一樁弒父案戴已，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至碑隆，卻和暖如春恭陡，著一層夾襖步出監(jiān)牢的瞬間蹬音，已是汗流浹背上煤。一陣腳步聲響...
開封第一講書人閱讀 33,819評(píng)論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留著淆，地道東北人劫狠。一個(gè)月前我還...
沈念sama閱讀 49,304評(píng)論 3贊 379
代替公主和親
正文我出身青樓，卻偏偏與公主長得像永部，于是被迫代替她去往敵國和親独泞。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,876評(píng)論 2贊 361