Digital Recognizer-KNN手寫數(shù)字識別

KNN描述
  1. KNN鄰近算法是簡單的分類與回歸方法,屬于監(jiān)督學(xué)習(xí)确垫,也屬于懶散學(xué)習(xí)法俄讹。給定一個訓(xùn)練集(包括訓(xùn)練數(shù)據(jù)和訓(xùn)練標(biāo)簽)和一個測試對象(只有測試數(shù)據(jù),需要預(yù)測測試標(biāo)簽)該算法計算測試對象和每個訓(xùn)練對象之間的距離或相似度邑商,這個測試對象在空間K個最近樣本中大多數(shù)屬于某個類別摄咆,那么這個測試對象的標(biāo)簽就屬于這個類別。

2.KNN工作原理:存在一個樣本數(shù)據(jù)集合人断,也稱為訓(xùn)練樣本集吭从,并且樣本集中每個數(shù)據(jù)都存在標(biāo)簽,即我們知道樣本集中每個數(shù)據(jù)所屬的類別恶迈。輸入沒有標(biāo)簽的新數(shù)據(jù)后涩金,將新數(shù)據(jù)的每個特征與樣本集中數(shù)據(jù)對應(yīng)的特征進行比較,算法提取樣本最相似(最鄰近)數(shù)據(jù)的分類標(biāo)簽暇仲。一般來說步做,只選取樣本集中前k個最相似的數(shù)據(jù),這就是KNN鄰近算法中k的出處熔吗,通常k不大于20的整數(shù)辆床。最后選擇k個最相似數(shù)據(jù)中出現(xiàn)最多的分類,作為新數(shù)據(jù)的分類

注釋:

k值較小桅狠,模型復(fù)雜度較高讼载,容易發(fā)生過擬合,學(xué)習(xí)的誤差會增大中跌,預(yù)測結(jié)果對鄰近實例點特別敏感咨堤;k值較大可以減少學(xué)習(xí)的誤差,但是學(xué)習(xí)的近似誤差會增大漩符,與輸入實例較遠的訓(xùn)練實例也會對預(yù)測取到左右一喘;因此,一般選擇k值較小且奇數(shù),也會用交叉驗證法選取最優(yōu)的k值凸克。

下面開始python sklearn的KNN算法

#讀取數(shù)據(jù)
import numpy as np
import pandas as pd
import os
os.chdir('/Users/xy/Desktop/機器學(xué)習(xí)/Digit Recognizer/digit-recognizer')
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
print(train.head(5),type(train),train.shape)#42000议蟆,785
print(test.head(5),type(test),test.shape)#28000,744

數(shù)據(jù)量很大

#提取訓(xùn)練數(shù)據(jù)特征
data = train.iloc[:,1:]
#提取訓(xùn)練標(biāo)簽
label = train.iloc[:,0]
#建立KNN模型
from sklearn import neighbors
model = neighbors.KNeighborsClassifier(n_neighbors=1)
model.fit(data,label)
pre = model.predict(test)
print(pre)

等著跑數(shù)兒中~~~~
經(jīng)過多次實驗萎战,k=1測試結(jié)果最接近

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末咐容,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子蚂维,更是在濱河造成了極大的恐慌戳粒,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,734評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件虫啥,死亡現(xiàn)場離奇詭異蔚约,居然都是意外死亡,警方通過查閱死者的電腦和手機涂籽,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評論 3 394
  • 文/潘曉璐 我一進店門苹祟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人评雌,你說我怎么就攤上這事苔咪。” “怎么了柳骄?”我有些...
    開封第一講書人閱讀 164,133評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長箕般。 經(jīng)常有香客問我耐薯,道長,這世上最難降的妖魔是什么丝里? 我笑而不...
    開封第一講書人閱讀 58,532評論 1 293
  • 正文 為了忘掉前任曲初,我火速辦了婚禮,結(jié)果婚禮上杯聚,老公的妹妹穿的比我還像新娘臼婆。我一直安慰自己,他們只是感情好幌绍,可當(dāng)我...
    茶點故事閱讀 67,585評論 6 392
  • 文/花漫 我一把揭開白布颁褂。 她就那樣靜靜地躺著,像睡著了一般傀广。 火紅的嫁衣襯著肌膚如雪颁独。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,462評論 1 302
  • 那天伪冰,我揣著相機與錄音誓酒,去河邊找鬼。 笑死贮聂,一個胖子當(dāng)著我的面吹牛靠柑,可吹牛的內(nèi)容都是我干的寨辩。 我是一名探鬼主播,決...
    沈念sama閱讀 40,262評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼歼冰,長吁一口氣:“原來是場噩夢啊……” “哼靡狞!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起停巷,我...
    開封第一講書人閱讀 39,153評論 0 276
  • 序言:老撾萬榮一對情侶失蹤耍攘,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后畔勤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蕾各,經(jīng)...
    沈念sama閱讀 45,587評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,792評論 3 336
  • 正文 我和宋清朗相戀三年庆揪,在試婚紗的時候發(fā)現(xiàn)自己被綠了式曲。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,919評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡缸榛,死狀恐怖吝羞,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情内颗,我是刑警寧澤钧排,帶...
    沈念sama閱讀 35,635評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站均澳,受9級特大地震影響恨溜,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜找前,卻給世界環(huán)境...
    茶點故事閱讀 41,237評論 3 329
  • 文/蒙蒙 一糟袁、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧躺盛,春花似錦项戴、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至躯枢,卻和暖如春则吟,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背锄蹂。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評論 1 269
  • 我被黑心中介騙來泰國打工氓仲, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 48,048評論 3 370
  • 正文 我出身青樓敬扛,卻偏偏與公主長得像晰洒,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子啥箭,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,864評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 本章節(jié)主要介紹機器學(xué)習(xí)傳統(tǒng)算法的監(jiān)督學(xué)習(xí)部分谍珊。監(jiān)督學(xué)習(xí)算法主要解決回歸和分類兩大問題。只能做回歸的算法是線性回歸急侥,...
    阿阿阿阿毛閱讀 8,484評論 0 6
  • 分類算法之K最近鄰算法(KNN)的Python實現(xiàn) KNN的定義 所謂K近鄰算法砌滞,即是給定一個訓(xùn)練數(shù)據(jù)集,對新的輸...
    盜夢者_56f2閱讀 3,294評論 0 2
  • 概述及標(biāo)簽體系搭建 1 概述 隨著信息技術(shù)的迅速發(fā)展和信息內(nèi)容的日益增長坏怪,“信息過載”問題愈來愈嚴(yán)重贝润,愈發(fā)帶來很大...
    JinkeyAI閱讀 22,795評論 10 241
  • 聽聞:剛開始是從大V那里看到的,從小白營開始铝宵,一直到了現(xiàn)在的基金課打掘,沒想到,一入門便深深的愛上了鹏秋。 ...
    起風(fēng)的清晨_577d閱讀 1,007評論 8 13
  • 世上不缺愛尊蚁,而是缺少平常心!人都喜歡爭強好勝侣夷,卻不知道自持横朋。所以有點小事就弄的滿城風(fēng)雨,還有就是沒有同情心看不起窮...
    劉秀娟A閱讀 198評論 0 0