K近鄰算法
機(jī)器學(xué)習(xí)算法是從數(shù)據(jù)中產(chǎn)生模型蜀细,也就是進(jìn)行學(xué)習(xí)的算法舟铜。我們把經(jīng)驗(yàn)提供給算法,它就能夠根據(jù)經(jīng)驗(yàn)數(shù)據(jù)產(chǎn)生模型奠衔。在面對新的情況時(shí)谆刨,模型就會為我們提供預(yù)測的結(jié)果。例如归斤,識別數(shù)字痊夭,文字時(shí),其實(shí)識別它們并不需要顏色官册,使用二值圖像就行生兆,而二值圖像的數(shù)字文字都是0,1組成膝宁,機(jī)器學(xué)習(xí)會根據(jù)0與1的位置匹配最相近的文字或者數(shù)字鸦难,從而得出結(jié)果。而機(jī)器學(xué)習(xí)中的K近鄰算法最適合識別圖像中的文字或者數(shù)字信息员淫。
K近鄰算法又稱為KNN算法合蔽,是非常經(jīng)典的機(jī)器學(xué)習(xí)算法。其原理非常簡單:對于一個(gè)新樣本介返,這里可以理解為一個(gè)新數(shù)字圖像或文字圖像拴事,K近鄰算法會在已有數(shù)據(jù)中尋找與它最相似的K個(gè)數(shù)據(jù)沃斤,或者說離它最近的K個(gè)數(shù)據(jù),如果這K個(gè)數(shù)據(jù)大多數(shù)屬于某個(gè)類別刃宵,則該樣本也屬于這個(gè)類別衡瓶。
識別數(shù)字
在OpenCV-Python開發(fā)指南的第一篇我們就介紹了二值圖像,二值圖像可以區(qū)分形狀已經(jīng)物體大概的輪廓牲证。如下圖所示:
這里的圖像A就是0和1的矩陣集合哮针,數(shù)字1代表有顏色的地方,數(shù)字0代表無顏色的地方坦袍。
這里十厢,我們提供給機(jī)器學(xué)習(xí)的樣本數(shù)據(jù)為1024個(gè)元素的一維數(shù)組,通過Excel表格提供捂齐,而圖像是一個(gè)矩陣并不是一維數(shù)組蛮放。所以,在處理原始圖像時(shí)奠宜,我們需要將圖片的矩陣數(shù)據(jù)轉(zhuǎn)換為一維數(shù)組包颁,以便于機(jī)器學(xué)習(xí)的匹配預(yù)測。
調(diào)整圖像
首先挎塌,我們需要識別的數(shù)字圖像可能并不是一個(gè)二值圖像徘六,甚至可能不是一個(gè)灰度圖像内边。所以我們需要將其轉(zhuǎn)換為二值圖像榴都。
其次,OpenCV轉(zhuǎn)換的二值圖像是一個(gè)矩陣漠其,而機(jī)器學(xué)習(xí)訓(xùn)練的數(shù)據(jù)是一個(gè)1024長度的一維數(shù)組嘴高。所以,我們還需要將圖像縮小為32*32像素的圖像和屎,這樣其轉(zhuǎn)換為一維數(shù)組才是1024個(gè)0拴驮,1數(shù)據(jù)。
具體代碼如下:
import cv2
img = cv2.imread("40.jpg")
img = cv2.resize(img, (32, 32))
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
t, img = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
img[img == 255] = 1
img_array= img.reshape(1, -1) # 轉(zhuǎn)換為一維數(shù)組
這里柴信,我們首先獲取圖像套啤,然后將圖像轉(zhuǎn)換為32*32像素的大小。接著随常,在轉(zhuǎn)換為灰度圖像潜沦,并通過二值化處理將圖像變更為0和255兩個(gè)值,最后將255白色的部分替換成1绪氛。最后唆鸡,將其轉(zhuǎn)換為一維數(shù)組。
K近鄰算法模型搭建
不管是K近鄰算法還是機(jī)器學(xué)習(xí)算法枣察,我們一般搭建機(jī)器學(xué)習(xí)模型都分為2個(gè)步驟争占。第1步燃逻,劃分訓(xùn)練集與測試集,第2步完成模型的搭建.
下面我們具體實(shí)現(xiàn)臂痕,代碼如下:
import cv2
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier as KNN
df = pd.read_excel("手寫字體識別.xlsx")
# 提取特征變量伯襟,識別數(shù)字時(shí),其特征就是1024個(gè)0握童,1數(shù)據(jù)逗旁,而目標(biāo)變量就是1024個(gè)數(shù)字組成對應(yīng)的結(jié)果數(shù)字
X = df.drop(columns="對應(yīng)數(shù)字")
Y = df['對應(yīng)數(shù)字']
x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size=0.2, random_state=111)
knn = KNN(n_neighbors=5)
knn.fit(x_train, y_train)
answer=knn.predict(img_array)
print("圖中的數(shù)字是:"+str(answer[0]))
這里,我們首先讀取手寫字體識別的數(shù)據(jù)集舆瘪,然后提取特征變量與目標(biāo)變量片效。
再然后,使用train_test_split函數(shù)將獲取的數(shù)據(jù)集分為測試集與訓(xùn)練集英古,test_size=0.2表示將20%的數(shù)據(jù)劃為測試集淀衣,訓(xùn)練集返回x_train,y_train召调,測試集返回x_test膨桥,y_test。
接著唠叛,使用訓(xùn)練集數(shù)據(jù)建模fit只嚣,這里K近鄰算法n_neighbors=5,表示選取5個(gè)近鄰點(diǎn)來決定數(shù)字圖片的分類艺沼,或者說識別判斷册舞。
建模完成之后,可以將上面轉(zhuǎn)換圖片的一維數(shù)組障般,直接代入到knn.predict函數(shù)中调鲸,得到預(yù)測的結(jié)果。我們測試的圖片如下:
運(yùn)行之后挽荡,得到的結(jié)果如下: