K近鄰算法識別數(shù)字---OpenCV-Python開發(fā)指南（40）

K近鄰算法

機(jī)器學(xué)習(xí)算法是從數(shù)據(jù)中產(chǎn)生模型蜀细，也就是進(jìn)行學(xué)習(xí)的算法舟铜。我們把經(jīng)驗(yàn)提供給算法，它就能夠根據(jù)經(jīng)驗(yàn)數(shù)據(jù)產(chǎn)生模型奠衔。在面對新的情況時(shí)谆刨，模型就會為我們提供預(yù)測的結(jié)果。例如归斤，識別數(shù)字痊夭，文字時(shí)，其實(shí)識別它們并不需要顏色官册，使用二值圖像就行生兆，而二值圖像的數(shù)字文字都是0，1組成膝宁，機(jī)器學(xué)習(xí)會根據(jù)0與1的位置匹配最相近的文字或者數(shù)字鸦难，從而得出結(jié)果。而機(jī)器學(xué)習(xí)中的K近鄰算法最適合識別圖像中的文字或者數(shù)字信息员淫。

K近鄰算法又稱為KNN算法合蔽，是非常經(jīng)典的機(jī)器學(xué)習(xí)算法。其原理非常簡單：對于一個(gè)新樣本介返，這里可以理解為一個(gè)新數(shù)字圖像或文字圖像拴事，K近鄰算法會在已有數(shù)據(jù)中尋找與它最相似的K個(gè)數(shù)據(jù)沃斤，或者說離它最近的K個(gè)數(shù)據(jù)，如果這K個(gè)數(shù)據(jù)大多數(shù)屬于某個(gè)類別刃宵，則該樣本也屬于這個(gè)類別衡瓶。

識別數(shù)字

在OpenCV-Python開發(fā)指南的第一篇我們就介紹了二值圖像，二值圖像可以區(qū)分形狀已經(jīng)物體大概的輪廓牲证。如下圖所示：

1.png

這里的圖像A就是0和1的矩陣集合哮针，數(shù)字1代表有顏色的地方，數(shù)字0代表無顏色的地方坦袍。

這里十厢，我們提供給機(jī)器學(xué)習(xí)的樣本數(shù)據(jù)為1024個(gè)元素的一維數(shù)組，通過Excel表格提供捂齐，而圖像是一個(gè)矩陣并不是一維數(shù)組蛮放。所以，在處理原始圖像時(shí)奠宜，我們需要將圖片的矩陣數(shù)據(jù)轉(zhuǎn)換為一維數(shù)組包颁，以便于機(jī)器學(xué)習(xí)的匹配預(yù)測。

調(diào)整圖像

首先挎塌，我們需要識別的數(shù)字圖像可能并不是一個(gè)二值圖像徘六，甚至可能不是一個(gè)灰度圖像内边。所以我們需要將其轉(zhuǎn)換為二值圖像榴都。

其次，OpenCV轉(zhuǎn)換的二值圖像是一個(gè)矩陣漠其，而機(jī)器學(xué)習(xí)訓(xùn)練的數(shù)據(jù)是一個(gè)1024長度的一維數(shù)組嘴高。所以，我們還需要將圖像縮小為32*32像素的圖像和屎，這樣其轉(zhuǎn)換為一維數(shù)組才是1024個(gè)0拴驮，1數(shù)據(jù)。

具體代碼如下：

import cv2

img = cv2.imread("40.jpg")
img = cv2.resize(img, (32, 32))
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
t, img = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
img[img == 255] = 1
img_array= img.reshape(1, -1)  # 轉(zhuǎn)換為一維數(shù)組

這里柴信，我們首先獲取圖像套啤，然后將圖像轉(zhuǎn)換為32*32像素的大小。接著随常，在轉(zhuǎn)換為灰度圖像潜沦，并通過二值化處理將圖像變更為0和255兩個(gè)值，最后將255白色的部分替換成1绪氛。最后唆鸡，將其轉(zhuǎn)換為一維數(shù)組。

K近鄰算法模型搭建

不管是K近鄰算法還是機(jī)器學(xué)習(xí)算法枣察，我們一般搭建機(jī)器學(xué)習(xí)模型都分為2個(gè)步驟争占。第1步燃逻，劃分訓(xùn)練集與測試集，第2步完成模型的搭建.

下面我們具體實(shí)現(xiàn)臂痕，代碼如下：

import cv2
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier as KNN

df = pd.read_excel("手寫字體識別.xlsx")
# 提取特征變量伯襟，識別數(shù)字時(shí)，其特征就是1024個(gè)0握童，1數(shù)據(jù)逗旁，而目標(biāo)變量就是1024個(gè)數(shù)字組成對應(yīng)的結(jié)果數(shù)字
X = df.drop(columns="對應(yīng)數(shù)字")
Y = df['對應(yīng)數(shù)字']

x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size=0.2, random_state=111)
knn = KNN(n_neighbors=5)
knn.fit(x_train, y_train)

answer=knn.predict(img_array)
print("圖中的數(shù)字是："+str(answer[0]))

這里，我們首先讀取手寫字體識別的數(shù)據(jù)集舆瘪，然后提取特征變量與目標(biāo)變量片效。

再然后，使用train_test_split函數(shù)將獲取的數(shù)據(jù)集分為測試集與訓(xùn)練集英古，test_size=0.2表示將20%的數(shù)據(jù)劃為測試集淀衣，訓(xùn)練集返回x_train，y_train召调，測試集返回x_test膨桥，y_test。

接著唠叛，使用訓(xùn)練集數(shù)據(jù)建模fit只嚣，這里K近鄰算法n_neighbors=5，表示選取5個(gè)近鄰點(diǎn)來決定數(shù)字圖片的分類艺沼，或者說識別判斷册舞。

建模完成之后，可以將上面轉(zhuǎn)換圖片的一維數(shù)組障般，直接代入到knn.predict函數(shù)中调鲸，得到預(yù)測的結(jié)果。我們測試的圖片如下：

運(yùn)行之后挽荡，得到的結(jié)果如下：

1.png

最后編輯于：2021.05.11 11:44:12

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末藐石，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子定拟，更是在濱河造成了極大的恐慌于微，老刑警劉巖，帶你破解...
沈念sama閱讀 217,734評論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件青自，死亡現(xiàn)場離奇詭異株依，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)性穿，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,931評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門勺三，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人需曾，你說我怎么就攤上這事吗坚∑碓叮” “怎么了？”我有些...
開封第一講書人閱讀 164,133評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵商源，是天一觀的道長车份。經(jīng)常有香客問我，道長牡彻，這世上最難降的妖魔是什么扫沼？我笑而不...
開封第一講書人閱讀 58,532評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮庄吼，結(jié)果婚禮上缎除，老公的妹妹穿的比我還像新娘。我一直安慰自己总寻，他們只是感情好器罐，可當(dāng)我...
茶點(diǎn)故事閱讀 67,585評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著渐行，像睡著了一般轰坊。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上祟印，一...
開封第一講書人閱讀 51,462評論 1贊 302
城市分裂傳說
那天肴沫，我揣著相機(jī)與錄音，去河邊找鬼蕴忆。笑死颤芬，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的孽文。我是一名探鬼主播驻襟，決...
沈念sama閱讀 40,262評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼芋哭！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起郁副，我...
開封第一講書人閱讀 39,153評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤减牺，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后存谎，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體拔疚，經(jīng)...
沈念sama閱讀 45,587評論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,792評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年既荚，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了稚失。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,919評論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡恰聘，死狀恐怖句各，靈堂內(nèi)的尸體忽然破棺而出吸占，到底是詐尸還是另有隱情，我是刑警寧澤凿宾，帶...
沈念sama閱讀 35,635評論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布矾屯，位于F島的核電站，受9級特大地震影響初厚，放射性物質(zhì)發(fā)生泄漏件蚕。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,237評論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一产禾、第九天我趴在偏房一處隱蔽的房頂上張望排作。院中可真熱鬧，春花似錦亚情、人聲如沸纽绍。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,855評論 0贊 22
一樁弒父案势似，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽拌夏。三九已至，卻和暖如春履因，著一層夾襖步出監(jiān)牢的瞬間障簿，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,983評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工栅迄，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留站故，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,048評論 3贊 370
代替公主和親
正文我出身青樓毅舆，卻偏偏與公主長得像西篓，于是被迫代替她去往敵國和親。傳聞我的和親對象是個(gè)殘疾皇子憋活，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,864評論 2贊 354

K近鄰算法識別數(shù)字---OpenCV-Python開發(fā)指南（40）

K近鄰算法

識別數(shù)字

調(diào)整圖像

K近鄰算法模型搭建

推薦閱讀更多精彩內(nèi)容