Android OCR工具之Tess-Two的使用

OCR is 什么東東八回?

ocr是Optical Character Recognition(光學字符識別)是指電子設備(例如掃描儀或數(shù)碼相機)檢查紙上打印的字符芹务,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程。

上面一段描述來源于某廣告度


什么叫Tesseract?

算了狸捕,這不是重點,我提供了一個學習什么是Tesseract的平臺众雷,需要的自己去看灸拍,點擊我跳轉

Tesseract的github地址:https://github.com/tesseract-ocr/tesseract

tess-two

Tesseract是使用C++實現(xiàn)的,在Android上使用有一丟丟的麻煩砾省,tess-two就是我們非常喜歡的東西了鸡岗,它封裝了Java API,可以在Android平臺上直接調(diào)用编兄,是不是開心到飛呢轩性。

tess-two的github地址:https://github.com/rmtheis/tess-two

tess-two的使用

這里我們以Android Studio開發(fā)工具為主。

Android版本要求狠鸳,最低2.3

在app的build.gradle里面添加

dependencies {

? ? implementation 'com.rmtheis:tess-two:9.1.0'

}

識別文字揣苏,我們還需要數(shù)據(jù)包

數(shù)據(jù)包下載地址:https://github.com/tesseract-ocr/tessdata

我們使用chi_sim.traineddata數(shù)據(jù)包悯嗓,根據(jù)自己的需求下載對應的數(shù)據(jù)包。

數(shù)據(jù)包下載下來放到assets文件夾下


val baseApi = TessBaseAPI()

baseApi.setDebug(true)

baseApi.init(path, LANGUAGE_FILE_NAME)//這里需要注意

baseApi.setImage(bitmap)

val text = baseApi.utF8Text

文字識別的關鍵代碼就五行卸察,是不是很簡單脯厨。

文字識別過程中,比較耗時坑质,所以建議放到子線程中合武。

baseApi.init在初始化中,需要兩個參數(shù)

第一個參數(shù):數(shù)據(jù)包放到存儲卡中位置

第二個參數(shù)洪乍,數(shù)據(jù)包的名稱

我們點擊進去看看init的實現(xiàn)


從源碼中可以看出,

1.數(shù)據(jù)包路徑不能為空?

2.數(shù)據(jù)包存儲位置上一級文件夾的名稱必須是tessdata

3.第二個參數(shù)必須是存儲在sd卡上的名稱夜焦,后綴必須是.traineddata

所以壳澳,在app啟動的時候,需要把assets文件夾中的數(shù)據(jù)包copy到存儲卡上茫经。

Android 6.0還要申請存儲卡讀寫權限哦巷波。

demo效果圖


demo 地址

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市卸伞,隨后出現(xiàn)的幾起案子抹镊,更是在濱河造成了極大的恐慌,老刑警劉巖荤傲,帶你破解...
    沈念sama閱讀 211,639評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件垮耳,死亡現(xiàn)場離奇詭異,居然都是意外死亡遂黍,警方通過查閱死者的電腦和手機终佛,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,277評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來雾家,“玉大人铃彰,你說我怎么就攤上這事⌒具郑” “怎么了牙捉?”我有些...
    開封第一講書人閱讀 157,221評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長敬飒。 經(jīng)常有香客問我邪铲,道長,這世上最難降的妖魔是什么无拗? 我笑而不...
    開封第一講書人閱讀 56,474評論 1 283
  • 正文 為了忘掉前任霜浴,我火速辦了婚禮,結果婚禮上蓝纲,老公的妹妹穿的比我還像新娘阴孟。我一直安慰自己晌纫,他們只是感情好,可當我...
    茶點故事閱讀 65,570評論 6 386
  • 文/花漫 我一把揭開白布永丝。 她就那樣靜靜地躺著锹漱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪慕嚷。 梳的紋絲不亂的頭發(fā)上哥牍,一...
    開封第一講書人閱讀 49,816評論 1 290
  • 那天,我揣著相機與錄音喝检,去河邊找鬼嗅辣。 笑死,一個胖子當著我的面吹牛挠说,可吹牛的內(nèi)容都是我干的澡谭。 我是一名探鬼主播,決...
    沈念sama閱讀 38,957評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼损俭,長吁一口氣:“原來是場噩夢啊……” “哼蛙奖!你這毒婦竟也來了?” 一聲冷哼從身側響起杆兵,我...
    開封第一講書人閱讀 37,718評論 0 266
  • 序言:老撾萬榮一對情侶失蹤雁仲,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后琐脏,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體攒砖,經(jīng)...
    沈念sama閱讀 44,176評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,511評論 2 327
  • 正文 我和宋清朗相戀三年日裙,在試婚紗的時候發(fā)現(xiàn)自己被綠了祭衩。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,646評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡阅签,死狀恐怖掐暮,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情政钟,我是刑警寧澤路克,帶...
    沈念sama閱讀 34,322評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站养交,受9級特大地震影響精算,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜碎连,卻給世界環(huán)境...
    茶點故事閱讀 39,934評論 3 313
  • 文/蒙蒙 一灰羽、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦廉嚼、人聲如沸玫镐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,755評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽恐似。三九已至,卻和暖如春傍念,著一層夾襖步出監(jiān)牢的瞬間矫夷,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,987評論 1 266
  • 我被黑心中介騙來泰國打工憋槐, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留双藕,地道東北人。 一個月前我還...
    沈念sama閱讀 46,358評論 2 360
  • 正文 我出身青樓阳仔,卻偏偏與公主長得像忧陪,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子驳概,可洞房花燭夜當晚...
    茶點故事閱讀 43,514評論 2 348