了解更多關(guān)注微信公眾號(hào)“木下學(xué)Python”吧~
原文:https://blog.csdn.net/zjkpy_5/article/details/82529092
tesserocr 只能通過(guò) .whl 安裝懦傍,pip 不行雹舀,在win系統(tǒng)下
tesseract要與tesserocr版本相對(duì)應(yīng),要不然可能報(bào)編碼錯(cuò)誤
但是全部下載好后不能用粗俱,import tesserocr,報(bào)解碼錯(cuò)誤说榆,在網(wǎng)上找了好久,都沒(méi)有這種現(xiàn)象出現(xiàn)
把代碼改成:import pyinsseract 就可以了寸认,例如签财,
import pytesseract
from PIL import Image
im = Image.open('123.jpg')
驗(yàn)證碼一般都是黑色,背景更加明亮废麻,檢查是否為黑色將文本分離出來(lái)
轉(zhuǎn)為灰度圖
gray = im.convert('L')
gray.save('456.jpg')
閾值化荠卷,遍歷每一個(gè)像素,閾值小于1保留
bw = gray.point(lambda x : 0 if x < 1 else 255,'1')
bw.save('789.jpg')
print(pytesseract.image_to_string(bw))