tesserocr

1.OCR,光學(xué)識(shí)別符。

tesserocr是Python的一個(gè)OCR庫(kù)世落,但其實(shí)是對(duì)tesseract做的一層Python APIde 封裝淮腾,所以他的核心是tesseract。因此屉佳,在安裝tesserocr之前谷朝,我們需要先安裝tesseract。

2.相關(guān)鏈接

tesserocr PyPI : https://pypi.python.org/pypi/tesserocr

tesseract下載地址: http://digi.bib.uni-mannheim.de/tesseract

3.windows下的安裝

先下載tesseract武花,他為tesserocr提供了支持

image

帶dev的為開(kāi)發(fā)版本圆凰,不帶dev的為穩(wěn)定版本。選擇不帶dev的下載体箕。如tesseract-ocr-setup-3.05.01.exe

下載完成后雙擊专钉,勾選Additional language data(download)選項(xiàng)來(lái)安裝OCR識(shí)別支持的語(yǔ)言包,這樣OCR便可以識(shí)別多國(guó)語(yǔ)言累铅,然后一路點(diǎn)擊Next按鈕跃须。

接下來(lái)再安裝tesserocr即可,此時(shí)使用pip安裝娃兽。

pip3 install tesserocr pillow

4.驗(yàn)證安裝

我們使用tesseract和tesserocr來(lái)分別進(jìn)行測(cè)試菇民。

image

以圖片https://raw.githubusercontent.com/Python3WebSpider/Testtess/master/image.png 可以直接下載

首先使用命令進(jìn)行測(cè)試,將圖片下載下來(lái)并保存為image.png 然后用tesseract命令進(jìn)行測(cè)試:

tesseract image.png result -l eng&& cat result.txt

運(yùn)行結(jié)果如下:

Tesseract Open Source OCR Engine v3.05.01 with Leptonica

Python3WebSpider

這里我們調(diào)用了tesseract命令,其中第一個(gè)參數(shù)為圖片名稱(chēng)玉雾。第二個(gè)參數(shù)為result為結(jié)果保存的目標(biāo)文件名稱(chēng)翔试,-l制定使用的語(yǔ)言包,在此使用英文(eng).然后复旬,在用cat命令將結(jié)果輸出垦缅。

裕興結(jié)果便是圖片的識(shí)別果果:Python3WebSpider 【园可以看到壁涎,這時(shí)已經(jīng)成功將圖片文字轉(zhuǎn)為電子文本了。

然后還可以利用Python代碼來(lái)測(cè)試志秃,這里就需要借助于tesserocr庫(kù)了怔球,測(cè)試代碼如下:

import tesserocr

from PIL import Image

image=Image.open('image.png')

print(tesserocr.image_to_text(image))

我們首先利用Image讀取了圖片文件,然后調(diào)用了tesserocr的image_to_text()方法浮还,再將其識(shí)別結(jié)果輸出竟坛。

運(yùn)行結(jié)果如下:

Python3WebSpider

另外,我們還可以直接調(diào)用file_to_text()方法钧舌,這樣可以達(dá)到同樣的效果:

import tesserocr

print(tesserocr.file_to_text('image.png'))

運(yùn)行結(jié)果:

Python3WebSpider

如果輸出成功担汤。則證明tesseract與tesserocr都已經(jīng)安裝成功。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末洼冻,一起剝皮案震驚了整個(gè)濱河市崭歧,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌撞牢,老刑警劉巖率碾,帶你破解...
    沈念sama閱讀 217,657評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異屋彪,居然都是意外死亡所宰,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門(mén)撼班,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)歧匈,“玉大人,你說(shuō)我怎么就攤上這事砰嘁。” “怎么了勘究?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,057評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵矮湘,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我口糕,道長(zhǎng)缅阳,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,509評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮十办,結(jié)果婚禮上秀撇,老公的妹妹穿的比我還像新娘。我一直安慰自己向族,他們只是感情好呵燕,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,562評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著件相,像睡著了一般再扭。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上夜矗,一...
    開(kāi)封第一講書(shū)人閱讀 51,443評(píng)論 1 302
  • 那天泛范,我揣著相機(jī)與錄音,去河邊找鬼紊撕。 笑死罢荡,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的对扶。 我是一名探鬼主播区赵,決...
    沈念sama閱讀 40,251評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼辩稽!你這毒婦竟也來(lái)了惧笛?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,129評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤逞泄,失蹤者是張志新(化名)和其女友劉穎患整,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體喷众,經(jīng)...
    沈念sama閱讀 45,561評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡各谚,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,779評(píng)論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了到千。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片昌渤。...
    茶點(diǎn)故事閱讀 39,902評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖憔四,靈堂內(nèi)的尸體忽然破棺而出膀息,到底是詐尸還是另有隱情,我是刑警寧澤了赵,帶...
    沈念sama閱讀 35,621評(píng)論 5 345
  • 正文 年R本政府宣布潜支,位于F島的核電站,受9級(jí)特大地震影響柿汛,放射性物質(zhì)發(fā)生泄漏冗酿。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,220評(píng)論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望裁替。 院中可真熱鬧项玛,春花似錦、人聲如沸弱判。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,838評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)裕循。三九已至臣嚣,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間剥哑,已是汗流浹背硅则。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,971評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留株婴,地道東北人怎虫。 一個(gè)月前我還...
    沈念sama閱讀 48,025評(píng)論 2 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像困介,于是被迫代替她去往敵國(guó)和親大审。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,843評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容