//簡(jiǎn)單的東西玩了一天...很尷尬
0.工具
- PIL py的圖片處理庫(kù)
- pytesseract
- tesseract-ocr
下載地址:http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.00dev.exe
安裝完成后要把路徑寫入Path
like this:
1.代碼
try:
import Image
except ImportError:
from PIL import Image
import pytesseract
image = Image.open('./pic/c_e_test.jpg')
code = pytesseract.image_to_string(image)
print('\n\n\n'+code)
2.圖片要求
純英文的,因?yàn)槟J(rèn)語言包是識(shí)別英文語言包.同時(shí)英文的識(shí)別率基本上100%.
- 更換中文語言包
下載地址
https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#special-data-files
下載完成后找到以下目錄替換原文件
3.其他
這次遇到了一個(gè)大坑 關(guān)于權(quán)限問題
由于我用SSD沒分區(qū) 全部文件在C盤導(dǎo)致有些需要管理員權(quán)限的無法調(diào)用
這個(gè)時(shí)候只能用管理員DOS手動(dòng)運(yùn)行程序
so.裝系統(tǒng)要分區(qū)Q荼铡4祭摹7芩辍殊鞭!