1.OCR,光學(xué)識(shí)別符。
tesserocr是Python的一個(gè)OCR庫(kù)世落,但其實(shí)是對(duì)tesseract做的一層Python APIde 封裝淮腾,所以他的核心是tesseract。因此屉佳,在安裝tesserocr之前谷朝,我們需要先安裝tesseract。
2.相關(guān)鏈接
tesserocr PyPI : https://pypi.python.org/pypi/tesserocr
tesseract下載地址: http://digi.bib.uni-mannheim.de/tesseract
3.windows下的安裝
先下載tesseract武花,他為tesserocr提供了支持
帶dev的為開(kāi)發(fā)版本圆凰,不帶dev的為穩(wěn)定版本。選擇不帶dev的下載体箕。如tesseract-ocr-setup-3.05.01.exe
下載完成后雙擊专钉,勾選Additional language data(download)選項(xiàng)來(lái)安裝OCR識(shí)別支持的語(yǔ)言包,這樣OCR便可以識(shí)別多國(guó)語(yǔ)言累铅,然后一路點(diǎn)擊Next按鈕跃须。
接下來(lái)再安裝tesserocr即可,此時(shí)使用pip安裝娃兽。
pip3 install tesserocr pillow
4.驗(yàn)證安裝
我們使用tesseract和tesserocr來(lái)分別進(jìn)行測(cè)試菇民。
以圖片https://raw.githubusercontent.com/Python3WebSpider/Testtess/master/image.png 可以直接下載
首先使用命令進(jìn)行測(cè)試,將圖片下載下來(lái)并保存為image.png 然后用tesseract命令進(jìn)行測(cè)試:
tesseract image.png result -l eng&& cat result.txt
運(yùn)行結(jié)果如下:
Tesseract Open Source OCR Engine v3.05.01 with Leptonica
Python3WebSpider
這里我們調(diào)用了tesseract命令,其中第一個(gè)參數(shù)為圖片名稱(chēng)玉雾。第二個(gè)參數(shù)為result為結(jié)果保存的目標(biāo)文件名稱(chēng)翔试,-l制定使用的語(yǔ)言包,在此使用英文(eng).然后复旬,在用cat命令將結(jié)果輸出垦缅。
裕興結(jié)果便是圖片的識(shí)別果果:Python3WebSpider 【园可以看到壁涎,這時(shí)已經(jīng)成功將圖片文字轉(zhuǎn)為電子文本了。
然后還可以利用Python代碼來(lái)測(cè)試志秃,這里就需要借助于tesserocr庫(kù)了怔球,測(cè)試代碼如下:
import tesserocr
from PIL import Image
image=Image.open('image.png')
print(tesserocr.image_to_text(image))
我們首先利用Image讀取了圖片文件,然后調(diào)用了tesserocr的image_to_text()方法浮还,再將其識(shí)別結(jié)果輸出竟坛。
運(yùn)行結(jié)果如下:
Python3WebSpider
另外,我們還可以直接調(diào)用file_to_text()方法钧舌,這樣可以達(dá)到同樣的效果:
import tesserocr
print(tesserocr.file_to_text('image.png'))
運(yùn)行結(jié)果:
Python3WebSpider
如果輸出成功担汤。則證明tesseract與tesserocr都已經(jīng)安裝成功。