這么好用的離線OCR項目腕够,我要摁頭安利給你!

image

爬蟲遇到了驗證碼無法識別舌劳?

PDF 里的掃描文檔讓你無從下手帚湘?

公司的有 OCR 需求但又不想花錢?

寫論文就想 參考 一段甚淡,但文庫下載都要收費大诸?

不用擔(dān)心這些了捅厂!

來吧朋友,這款適合人類食用的離線中文 OCR 項目解決你所有的煩惱资柔!

今天的主角就是這款在 github 上開源的項目:TrWebOCR

介紹

項目是基于開源離線 OCR 項目 Tr構(gòu)建的焙贷,

解決了 Tr 不支持并發(fā)的問題,

并且提供了 web 頁面和 web 接口可使用贿堰,

因此無論是日常的使用還是其他項目調(diào)用也都十分的方便辙芍。

效果

明人不說暗話,是騾子是馬拉出來遛遛就知道了羹与!

下面是可能比較常用的兩個場景:文檔驗證碼的識別故硅。

文檔識別的置信度基本在 99%,驗證碼識別出的置信度也在 72%以上纵搁。

文檔識別

驗證碼識別

這極簡的界面吃衅,

超高的識別率,

強大的功能腾誉,

你心動了嗎徘层?

如何安裝

再優(yōu)秀的東西,

如果安裝就得花上半天利职,

那也足以勸退很多人趣效,

因此,

它的部署起來是極其容易的眼耀。

即使你想在自己的 Windows 或 MacOS 上部署也沒有問題英支,

通過 Docker 就可以完美解決~

在 Linux 服務(wù)器部署

在服務(wù)器上部署只需要 3 步:

  1. 安裝 python3.7

推薦使用 miniconda )

  1. 執(zhí)行 install.py
python install.py  
  1. 安裝依賴包
pip install -r requirements.txt

搞定!

運行 main.py后哮伟,

web 服務(wù)默認(rèn)運行在 8089 端口干花,

看到以下輸出就代表運行成功了:

$ python backend/main.py
> tr 1.5.0 https://github.com/myhub/tr
> server is running: 0.0.0.0:8089

如果有報錯,可以參考項目的 wiki 來解決

在 Docker 部署

在 Docker 上部署就更加簡單了楞黄,

該方法適合非 Linux 的用戶池凄,

或者對環(huán)境有潔癖的用戶。

項目提供了 Dockerfile鬼廓,

只需要簡單的build, run 就可以運行了肿仑!

  1. 編譯 Dockerfile
$ docker build -t TrWebOCR:latest .
  1. 運行一個容器
$ docker run -itd -p 8089:8089 --name trweb trweb-ocr:latest /bin/bash  

這里把容器的 8089 端口映射到了物理機的 8089 上,

但如果你不喜歡映射碎税,

去掉 run 后面的 -p 8089:8089 尤慰,

就可以通過 Docker 容器的 ip 來訪問了。

配置的要求

最后一點雷蹂,也是最重要的一點伟端。

該項目不需要太高的配置!7嘶汀责蝠!

一個 1 核 2G的機器就能夠跑得起來了党巾!

但如果你的項目對并發(fā)的要求比較高的話,

還是得上高配置一點的機器~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末霜医,一起剝皮案震驚了整個濱河市齿拂,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌肴敛,老刑警劉巖署海,帶你破解...
    沈念sama閱讀 217,907評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異值朋,居然都是意外死亡叹侄,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,987評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人缚窿,你說我怎么就攤上這事∪銮浚” “怎么了?”我有些...
    開封第一講書人閱讀 164,298評論 0 354
  • 文/不壞的土叔 我叫張陵笙什,是天一觀的道長飘哨。 經(jīng)常有香客問我,道長琐凭,這世上最難降的妖魔是什么芽隆? 我笑而不...
    開封第一講書人閱讀 58,586評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮统屈,結(jié)果婚禮上胚吁,老公的妹妹穿的比我還像新娘。我一直安慰自己愁憔,他們只是感情好腕扶,可當(dāng)我...
    茶點故事閱讀 67,633評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著吨掌,像睡著了一般半抱。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上膜宋,一...
    開封第一講書人閱讀 51,488評論 1 302
  • 那天窿侈,我揣著相機與錄音,去河邊找鬼秋茫。 笑死史简,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的学辱。 我是一名探鬼主播乘瓤,決...
    沈念sama閱讀 40,275評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼策泣!你這毒婦竟也來了衙傀?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,176評論 0 276
  • 序言:老撾萬榮一對情侶失蹤萨咕,失蹤者是張志新(化名)和其女友劉穎统抬,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體危队,經(jīng)...
    沈念sama閱讀 45,619評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡聪建,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,819評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了茫陆。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片金麸。...
    茶點故事閱讀 39,932評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖簿盅,靈堂內(nèi)的尸體忽然破棺而出挥下,到底是詐尸還是另有隱情,我是刑警寧澤桨醋,帶...
    沈念sama閱讀 35,655評論 5 346
  • 正文 年R本政府宣布棚瘟,位于F島的核電站,受9級特大地震影響喜最,放射性物質(zhì)發(fā)生泄漏偎蘸。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,265評論 3 329
  • 文/蒙蒙 一瞬内、第九天 我趴在偏房一處隱蔽的房頂上張望迷雪。 院中可真熱鬧,春花似錦遂鹊、人聲如沸振乏。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,871評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽慧邮。三九已至,卻和暖如春舟陆,著一層夾襖步出監(jiān)牢的瞬間误澳,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,994評論 1 269
  • 我被黑心中介騙來泰國打工秦躯, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留忆谓,地道東北人。 一個月前我還...
    沈念sama閱讀 48,095評論 3 370
  • 正文 我出身青樓踱承,卻偏偏與公主長得像倡缠,于是被迫代替她去往敵國和親哨免。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,884評論 2 354