Task03-K近鄰(k-nearest neighbors)-算法實(shí)踐(天池機(jī)器學(xué)習(xí)訓(xùn)練營D8)

本筆記為參加阿里云“天池龍珠計(jì)劃機(jī)器學(xué)習(xí)訓(xùn)練營”所做的學(xué)習(xí)記錄掐场，代碼及知識(shí)內(nèi)容均來源于訓(xùn)練營泣矛，本人稍作擴(kuò)充。
具體活動(dòng)內(nèi)容請(qǐng)移步阿里云天池龍珠計(jì)劃; 同時(shí)感謝公眾號(hào)“機(jī)器學(xué)習(xí)煉丹術(shù)”的介紹、推廣和組織。

2.4 算法實(shí)戰(zhàn)

2.4.1 Demo數(shù)據(jù)集--kNN分類

Step1: 庫函數(shù)導(dǎo)入

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.colors import ListedColormap
from sklearn.neighbors import KNeighborsClassifier
from sklearn import datasets

Step2: 數(shù)據(jù)導(dǎo)入

# 使用鶯尾花數(shù)據(jù)集的前兩維數(shù)據(jù)，便于數(shù)據(jù)可視化
iris = datasets.load_iris()
X = iris.data[:, :2]
y = iris.target

Step3: 模型訓(xùn)練&可視化

k_list = [1, 3, 5, 8, 10, 15]
h = .02
# 創(chuàng)建不同顏色的畫布
cmap_light = ListedColormap(['orange', 'cyan', 'cornflowerblue'])
cmap_bold = ListedColormap(['darkorange', 'c', 'darkblue'])

plt.figure(figsize=(15,14))
# 根據(jù)不同的k值進(jìn)行可視化
for ind,k in enumerate(k_list):
    clf = KNeighborsClassifier(k)
    clf.fit(X, y)
    # 畫出決策邊界
    x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
    y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h),
                         np.arange(y_min, y_max, h))
    Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
    # 根據(jù)邊界填充顏色
    Z = Z.reshape(xx.shape)

    plt.subplot(321+ind)  
    plt.pcolormesh(xx, yy, Z, cmap=cmap_light)
    # 數(shù)據(jù)點(diǎn)可視化到畫布
    plt.scatter(X[:, 0], X[:, 1], c=y, cmap=cmap_bold,
                edgecolor='k', s=20)
    plt.xlim(xx.min(), xx.max())
    plt.ylim(yy.min(), yy.max())
    plt.title("3-Class classification (k = %i)"% k)

plt.show()

KNNFig1.jpg

Step4: 原理簡析

如果選擇較小的K值洞就，就相當(dāng)于用較小的領(lǐng)域中的訓(xùn)練實(shí)例進(jìn)行預(yù)測盆繁，例如當(dāng)k=1的時(shí)候，在分界點(diǎn)位置的數(shù)據(jù)很容易受到局部的影響旬蟋，圖中藍(lán)色的部分中還有部分綠色塊油昂，主要是數(shù)據(jù)太局部敏感。當(dāng)k=15的時(shí)候倾贰，不同的數(shù)據(jù)基本根據(jù)顏色分開冕碟，當(dāng)時(shí)進(jìn)行預(yù)測的時(shí)候，會(huì)直接落到對(duì)應(yīng)的區(qū)域匆浙，模型相對(duì)更加魯棒安寺。

2.4.2 鶯尾花數(shù)據(jù)集--kNN分類

Step1: 庫函數(shù)導(dǎo)入

import numpy as np
# 加載鶯尾花數(shù)據(jù)集
from sklearn import datasets
# 導(dǎo)入KNN分類器
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split

Step2: 數(shù)據(jù)導(dǎo)入&分析

# 導(dǎo)入鶯尾花數(shù)據(jù)集
iris = datasets.load_iris()

X = iris.data
y = iris.target
# 得到訓(xùn)練集合和驗(yàn)證集合, 8: 2
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

Step3: 模型訓(xùn)練
這里我們設(shè)置參數(shù)k(n_neighbors)=5, 使用歐式距離(metric=minkowski & p=2)

# 訓(xùn)練模型
clf = KNeighborsClassifier(n_neighbors=5, p=2, metric="minkowski")
clf.fit(X_train, y_train)

Step4:模型預(yù)測&可視化

# 預(yù)測
X_pred = clf.predict(X_test)
acc = sum(X_pred == y_test) / X_pred.shape[0]
print("預(yù)測的準(zhǔn)確率ACC: %.3f" % acc)

# Output:
# 預(yù)測的準(zhǔn)確率ACC: 0.967

我們用表格來看一下KNN的訓(xùn)練和預(yù)測過程。這里用表格進(jìn)行可視化：

訓(xùn)練數(shù)據(jù)[表格對(duì)應(yīng)list]

KNNFig2.jpg
knn.fit(X, y)的過程可以簡單認(rèn)為是表格存儲(chǔ)

KNNFig3.jpg

3.knn.predict(x)預(yù)測過程會(huì)計(jì)算x和所有訓(xùn)練數(shù)據(jù)的距離首尼。以 ??=[5.,3.6,1.4,0.2]挑庶， ??=0為例，這里我們使用歐式距離進(jìn)行計(jì)算, 預(yù)測過程如下:

3.1 計(jì)算x和所有訓(xùn)練數(shù)據(jù)的距離

KNNFig4.jpg

3.2 根據(jù)距離進(jìn)行編號(hào)排序

KNNFig5.jpg

3.3 我們設(shè)置k=5,選擇距離最近的k個(gè)樣本進(jìn)行投票

KNNFig6.jpg

3.4: k近鄰的label進(jìn)行投票
nn_labels = [0, 0, 0, 0, 1] --> 得到最后的結(jié)果0软能。

學(xué)習(xí)感想：

可視化那部分好難啊迎捺，死磕了兩天才能理解個(gè)大概。還是要加油學(xué)習(xí)安榕拧凳枝！

參考資料：

B站視頻： Python算法之knn

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市跋核，隨后出現(xiàn)的幾起案子岖瑰，更是在濱河造成了極大的恐慌，老刑警劉巖砂代，帶你破解...
沈念sama閱讀 222,807評(píng)論 6贊 518
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件锭环，死亡現(xiàn)場離奇詭異，居然都是意外死亡泊藕，警方通過查閱死者的電腦和手機(jī)辅辩，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,284評(píng)論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門难礼，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人玫锋，你說我怎么就攤上這事蛾茉。” “怎么了撩鹿？”我有些...
開封第一講書人閱讀 169,589評(píng)論 0贊 363
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵谦炬，是天一觀的道長。經(jīng)常有香客問我节沦，道長键思，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 60,188評(píng)論 1贊 300
?港島之戀（遺憾婚禮）
正文為了忘掉前任甫贯，我火速辦了婚禮吼鳞，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘叫搁。我一直安慰自己赔桌，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 69,185評(píng)論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布渴逻。她就那樣靜靜地躺著疾党，像睡著了一般。火紅的嫁衣襯著肌膚如雪惨奕。梳的紋絲不亂的頭發(fā)上雪位，一...
開封第一講書人閱讀 52,785評(píng)論 1贊 314
城市分裂傳說
那天，我揣著相機(jī)與錄音梨撞，去河邊找鬼茧泪。笑死，一個(gè)胖子當(dāng)著我的面吹牛聋袋，可吹牛的內(nèi)容都是我干的队伟。我是一名探鬼主播，決...
沈念sama閱讀 41,220評(píng)論 3贊 423
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼幽勒，長吁一口氣：“原來是場噩夢啊……” “哼嗜侮！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起啥容，我...
開封第一講書人閱讀 40,167評(píng)論 0贊 277
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤锈颗，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后咪惠，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體击吱，經(jīng)...
沈念sama閱讀 46,698評(píng)論 1贊 320
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,767評(píng)論 3贊 343
?白月光啟示錄
正文我和宋清朗相戀三年遥昧，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了覆醇。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片朵纷。...
茶點(diǎn)故事閱讀 40,912評(píng)論 1贊 353
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖永脓，靈堂內(nèi)的尸體忽然破棺而出袍辞，到底是詐尸還是另有隱情，我是刑警寧澤常摧，帶...
沈念sama閱讀 36,572評(píng)論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布搅吁，位于F島的核電站，受9級(jí)特大地震影響落午，放射性物質(zhì)發(fā)生泄漏谎懦。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 42,254評(píng)論 3贊 336
男人毒藥：我在死后第九天來索命
文/蒙蒙一溃斋、第九天我趴在偏房一處隱蔽的房頂上張望界拦。院中可真熱鬧，春花似錦盐类、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,746評(píng)論 0贊 25
一樁弒父案在跳，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至隐岛，卻和暖如春猫妙，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背聚凹。一陣腳步聲響...
開封第一講書人閱讀 33,859評(píng)論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工割坠，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人妒牙。一個(gè)月前我還...
沈念sama閱讀 49,359評(píng)論 3贊 379
代替公主和親
正文我出身青樓彼哼，卻偏偏與公主長得像，于是被迫代替她去往敵國和親湘今。傳聞我的和親對(duì)象是個(gè)殘疾皇子敢朱，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,922評(píng)論 2贊 361