iOS實現(xiàn)圖像文字識別功能

最近在研究圖像文字識別與圖像對比的問題,遇到的一些坑和解決方案在這里記錄一下

首先使用的是Tesseract毅该,一款由HP實驗室開發(fā)由Google維護的開源OCR(Optical Character Recognition , 光學字符識別)引擎呛牲,與Microsoft Office Document Imaging(MODI)相比欠拾,我們可以不斷的訓練的庫逊躁,使圖像轉(zhuǎn)換文本的能力不斷增強缅疟;如果團隊深度需要唆铐,還可以以它為模板,開發(fā)出符合自身需求的OCR引擎爹耗。
在github下載demo源碼圖像識別 Tesseract OCR,打開demo運行是可以的耙考,但是自己放一張含有中文的圖像時就會出現(xiàn)亂碼,這時需要下載漢文包漢化包鏈接地址潭兽,在里面找到chi_sim.traineddata并下載倦始。

將chi_sim.traineddata放到項目下的tessdata文件夾,這里要特別注意山卦,一定不要直接拖進Xcode鞋邑,一定要在目錄里面打開文件夾放進去。

然后修改代碼里的代碼

G8RecognitionOperation *operation = [[G8RecognitionOperation alloc] initWithLanguage:@"eng"];

改為

G8RecognitionOperation *operation = [[G8RecognitionOperation alloc] initWithLanguage:@"chi_sim"];

問題1:改成chi_sim會報allow_blob_division
解決方法是這個

問題2:為什么改成漢化包OCR Result顯示是空的或者是亂碼
暫時用原生的庫只對黑體字識別率較高,如果圖片中是其他字體或者有背景干擾就會顯示為空,而且遇到復雜的黑體字就識別不了了,比如這樣

lALOsYP2kM0FNs0C7g_750_1334.png_620x10000q90g.jpg

鑫被識別成了蠢

想要有其他字體識別能力或者提高識別率需要進行字庫訓練,訓練方法,這個需要大量的長時間的訓練

問題3:報"actual_tessdata_num_entries_ <= TESSDATA_NUM_ENTRIES:Error:Assert failed:in file tessdatamanager.cpp, line 53"錯誤
這個是因為下載的 traineddata 版本不對,如果你報了這個錯誤應該下載這個版本的中文包,把之前的替換掉就可以了

暫時我遇到的就是這三個問題,如果你使用此教程遇到更多問題歡迎留言

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末账蓉,一起剝皮案震驚了整個濱河市枚碗,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌铸本,老刑警劉巖肮雨,帶你破解...
    沈念sama閱讀 206,602評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異箱玷,居然都是意外死亡酷含,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,442評論 2 382
  • 文/潘曉璐 我一進店門汪茧,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人限番,你說我怎么就攤上這事舱污。” “怎么了弥虐?”我有些...
    開封第一講書人閱讀 152,878評論 0 344
  • 文/不壞的土叔 我叫張陵扩灯,是天一觀的道長。 經(jīng)常有香客問我霜瘪,道長珠插,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,306評論 1 279
  • 正文 為了忘掉前任颖对,我火速辦了婚禮捻撑,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己顾患,他們只是感情好番捂,可當我...
    茶點故事閱讀 64,330評論 5 373
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著江解,像睡著了一般设预。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上犁河,一...
    開封第一講書人閱讀 49,071評論 1 285
  • 那天鳖枕,我揣著相機與錄音,去河邊找鬼桨螺。 笑死宾符,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的彭谁。 我是一名探鬼主播吸奴,決...
    沈念sama閱讀 38,382評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼缠局!你這毒婦竟也來了则奥?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,006評論 0 259
  • 序言:老撾萬榮一對情侶失蹤狭园,失蹤者是張志新(化名)和其女友劉穎读处,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體唱矛,經(jīng)...
    沈念sama閱讀 43,512評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡罚舱,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,965評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了绎谦。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片管闷。...
    茶點故事閱讀 38,094評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖窃肠,靈堂內(nèi)的尸體忽然破棺而出包个,到底是詐尸還是另有隱情,我是刑警寧澤冤留,帶...
    沈念sama閱讀 33,732評論 4 323
  • 正文 年R本政府宣布碧囊,位于F島的核電站,受9級特大地震影響纤怒,放射性物質(zhì)發(fā)生泄漏糯而。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,283評論 3 307
  • 文/蒙蒙 一泊窘、第九天 我趴在偏房一處隱蔽的房頂上張望熄驼。 院中可真熱鬧像寒,春花似錦、人聲如沸谜洽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,286評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽阐虚。三九已至序臂,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間实束,已是汗流浹背奥秆。 一陣腳步聲響...
    開封第一講書人閱讀 31,512評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留咸灿,地道東北人构订。 一個月前我還...
    沈念sama閱讀 45,536評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像避矢,于是被迫代替她去往敵國和親悼瘾。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,828評論 2 345

推薦閱讀更多精彩內(nèi)容