愛情,能夠讓普通的日子變得熠熠生輝禽额。感謝喜歡著別人的每一個(gè)人,是因?yàn)槲覀兊哪抗饨课矗瑢?duì)方熠熠生輝嚼鹉。
項(xiàng)目背景
公司進(jìn)行海報(bào)運(yùn)營(yíng)活動(dòng),需要判斷用戶是否確實(shí)在微信朋友圈向所有人分享了指定的海報(bào), 我們用tensorFlow訓(xùn)練了一個(gè)模型來(lái)智能判定『┘椋現(xiàn)又提出需求革屠,要求模型能夠根據(jù)左上角的字來(lái)對(duì)海報(bào)進(jìn)行分類。為了更快的響應(yīng)運(yùn)營(yíng)需求排宰,我花了半天用opencv-python做了一個(gè)臨時(shí)分類服務(wù)似芝,還有點(diǎn)意思,分享一下板甘。
火花思維 | 火花AI課 |
---|---|
分類思路
- 把圖片字樣截取出來(lái)
- 用圖片字樣訓(xùn)練分類模型(logit)
- 進(jìn)行預(yù)測(cè)
截取圖片字樣
import cv2
def cut_words(image):
image = image[0 : int(image.shape[0] / 6), 0 : int(image.shape[1] / 2)]
image_8bit = cv2.convertScaleAbs(image)
gray = cv2.cvtColor(image_8bit, cv2.COLOR_BGR2GRAY)
erode = cv2.erode(gray, np.ones((3, 2), np.uint8), iterations=3)
_, thresh = cv2.threshold(erode, 60, 255, cv2.THRESH_BINARY)
contours, _ = cv2.findContours(thresh, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE)
# filter the target contour
cv2.imwrite(output_path, image[min_y:max_y, min_x:max_x])
- 明確目標(biāo)党瓮。
-
image[0 : int(image.shape[0] / 6), 0 : int(image.shape[1] / 2)]
, 字樣一定在海報(bào)的左上角,所以第一步就截取出更小的圖片操作盐类,減少無(wú)關(guān)特征寞奸。 -
cv2.convertScaleAbs(image)
, 降低圖片位數(shù), opencv的基本操作,位數(shù)太高在跳,操作不了... -
cv2.cvtColor(image_8bit, cv2.COLOR_BGR2GRAY)
, 更換顏色空間枪萄,基本操作。不同的顏色空間猫妙,方便做不一樣的事情瓷翻。灰度空間非常適合跟蹤特點(diǎn)顏色的物體吐咳。
- 腐蝕圖像
- 形態(tài)學(xué)操作逻悠,簡(jiǎn)單點(diǎn)說,腐蝕【erode】讓黑的變黑韭脊,膨脹【dilate】讓白的變白童谒。
-
cv2.erode(gray, np.ones((3, 2), np.uint8), iterations=3)
, 海報(bào)中的字樣是黑色,我們這里用腐蝕沪羔,讓黑的變黑饥伊。- 第一個(gè)參數(shù):灰度圖片
- 第二個(gè)參數(shù):像素框大小象浑。從左上開始檢查圖片,如果每 3 * 2 個(gè)像素框內(nèi)有黑色像素琅豆,則讓整個(gè)像素框變黑愉豺。
- 第三個(gè)參數(shù):迭代次數(shù)。用同樣大小的像素框檢查三次茫因。
- 二極化
- 現(xiàn)在圖片中還有很多顏色蚪拦,為了更好的做edge detection(邊界偵查),提高物體的對(duì)比度冻押,我們把圖片變成黑白兩色驰贷。
-
cv2.threshold(erode, 60, 255, cv2.THRESH_BINARY)
, 這里有多種模式,挺長(zhǎng)的洛巢,我百度了一個(gè)中文網(wǎng)站括袒,感興趣看看。
- 找輪廓
- 邊界偵查稿茉,找輪廓锹锰。
-
cv2.findContours(thresh, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE)
, 這里也有很多模式,但是沒那么有意思漓库,主要原理是矩陣element wise相乘恃慧,感興趣可以深入了解。
- 截取目標(biāo)
- 選取輪廓的上下左右的最值渺蒿,截成矩形圖片糕伐。
訓(xùn)練和預(yù)測(cè)
-
cv2.resize(img, (max_x, max_y), interpolation=cv2.INTER_AREA)
, 把所有圖片都變成一個(gè)大小蘸嘶; -
x = img.flat, y = 0
, 把圖片攤平當(dāng)作模型特征, 0, 1代表分類 -
clf = LogisticRegression(max_iter=10000).fit(x_train, y_train)
, 用logit訓(xùn)練模型 -
clf.predict(x_test)
, 預(yù)測(cè)結(jié)果
整個(gè)分類過程很簡(jiǎn)單,也很直接陪汽。20%的努力训唱,換得80%的價(jià)值,體現(xiàn)了敏捷精神挚冤。
愿况增,每一位讀者,都能收獲幸福的愛情训挡。