人工智能Java SDK:文字識別(OCR)工具箱

目錄:

http://www.aias.top/

文字識別(OCR)工具箱

文字識別(OCR)目前在多個行業(yè)中得到了廣泛應用几于,比如金融行業(yè)的單據(jù)識別輸入,餐飲行業(yè)中的發(fā)票識別,
交通領域的車票識別,企業(yè)中各種表單識別,以及日常工作生活中常用的身份證拂封,駕駛證,護照識別等等鹦蠕。
OCR(文字識別)是目前常用的一種AI能力冒签。

OCR工具箱功能:

  1. 方向檢測
  • 0度
  • 90度
  • 180度
  • 270度
    detect_direction
  1. 圖片旋轉

  2. 文字識別(提供三個模型)

  • mobile模型
  • light模型
  • 服務器端模型
  1. 版面分析(支持5個類別, 用于配合文字識別,表格識別的流水線處理)
  • Text
  • Title
  • List
  • Table
  • Figure
  1. 表格識別
  • 生成html表格
  • 生成excel文件

運行OCR識別例子

1.1 文字方向檢測:

  • 例子代碼: OcrDetectionExample.java
  • 運行成功后钟病,命令行應該看到下面的信息:
[INFO ] - Result image has been saved in: build/output/detect_result.png
[INFO ] - [
    class: "0", probability: 1.00000, bounds: [x=0.073, y=0.069, width=0.275, height=0.026]
    class: "0", probability: 1.00000, bounds: [x=0.652, y=0.158, width=0.222, height=0.040]
    class: "0", probability: 1.00000, bounds: [x=0.143, y=0.252, width=0.144, height=0.026]
    class: "0", probability: 1.00000, bounds: [x=0.628, y=0.328, width=0.168, height=0.026]
    class: "0", probability: 1.00000, bounds: [x=0.064, y=0.330, width=0.450, height=0.023]
]
  • 輸出圖片效果如下:


    detect_result

1.2 文字方向檢測幫助類(增加置信度信息顯示萧恕,便于調試):

  • 例子代碼: OcrDetectionHelperExample.java
  • 運行成功后刚梭,命令行應該看到下面的信息:
[INFO ] - Result image has been saved in: build/output/detect_result_helper.png
[INFO ] - [
    class: "0 :1.0", probability: 1.00000, bounds: [x=0.073, y=0.069, width=0.275, height=0.026]
    class: "0 :1.0", probability: 1.00000, bounds: [x=0.652, y=0.158, width=0.222, height=0.040]
    class: "0 :1.0", probability: 1.00000, bounds: [x=0.143, y=0.252, width=0.144, height=0.026]
    class: "0 :1.0", probability: 1.00000, bounds: [x=0.628, y=0.328, width=0.168, height=0.026]
    class: "0 :1.0", probability: 1.00000, bounds: [x=0.064, y=0.330, width=0.450, height=0.023]
]
  • 輸出圖片效果如下:


    detect_result_helper

2. 圖片旋轉:

每調用一次rotateImg方法,會使圖片逆時針旋轉90度票唆。

  • 例子代碼: RotationExample.java
  • 旋轉前圖片:


    ticket_0
  • 旋轉后圖片效果如下:


    rotate_result

3. 文字識別:

再使用本方法前朴读,請調用上述方法使圖片文字呈水平(0度)方向。

  • 例子代碼: LightOcrRecognitionExample.java
  • 運行成功后走趋,命令行應該看到下面的信息:
[INFO ] - [
    class: "你", probability: -1.0e+00, bounds: [x=0.319, y=0.164, width=0.050, height=0.057]
    class: "永遠都", probability: -1.0e+00, bounds: [x=0.329, y=0.349, width=0.206, height=0.044]
    class: "無法叫醒一個", probability: -1.0e+00, bounds: [x=0.328, y=0.526, width=0.461, height=0.044]
    class: "裝睡的人", probability: -1.0e+00, bounds: [x=0.330, y=0.708, width=0.294, height=0.043]
]
  • 輸出圖片效果如下:


    ocr_result

4. 版面分析:

  • 運行成功后衅金,命令行應該看到下面的信息:
[INFO ] - [
    class: "Text", probability: 0.98750, bounds: [x=0.081, y=0.620, width=0.388, height=0.183]
    class: "Text", probability: 0.98698, bounds: [x=0.503, y=0.464, width=0.388, height=0.167]
    class: "Text", probability: 0.98333, bounds: [x=0.081, y=0.465, width=0.387, height=0.121]
    class: "Figure", probability: 0.97186, bounds: [x=0.074, y=0.091, width=0.815, height=0.304]
    class: "Table", probability: 0.96995, bounds: [x=0.506, y=0.712, width=0.382, height=0.143]
]
  • 輸出圖片效果如下:


    layout

5. 表格識別:

  • 運行成功后,命令行應該看到下面的信息:
<html>
 <body>
  <table>
   <thead>
    <tr>
     <td>Methods</td>
     <td>R</td>
     <td>P</td>
     <td>F</td>
     <td>FPS</td>
    </tr>
   </thead>
   <tbody>
    <tr>
     <td>SegLink[26]</td>
     <td>70.0</td>
     <td>86.0</td>
     <td>770</td>
     <td>89</td>
    </tr>
    <tr>
     <td>PixelLink[4j</td>
     <td>73.2</td>
     <td>83.0</td>
     <td>77.8</td>
     <td></td>
    </tr>
...
   </tbody>
  </table> 
 </body>
</html>
  • 輸出圖片效果如下:


    table
  • 生成excel效果如下:


    excel
最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末簿煌,一起剝皮案震驚了整個濱河市氮唯,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌姨伟,老刑警劉巖惩琉,帶你破解...
    沈念sama閱讀 219,188評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異夺荒,居然都是意外死亡瞒渠,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評論 3 395
  • 文/潘曉璐 我一進店門技扼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來伍玖,“玉大人,你說我怎么就攤上這事淮摔∷骄冢” “怎么了?”我有些...
    開封第一講書人閱讀 165,562評論 0 356
  • 文/不壞的土叔 我叫張陵和橙,是天一觀的道長仔燕。 經(jīng)常有香客問我,道長魔招,這世上最難降的妖魔是什么晰搀? 我笑而不...
    開封第一講書人閱讀 58,893評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮办斑,結果婚禮上外恕,老公的妹妹穿的比我還像新娘。我一直安慰自己乡翅,他們只是感情好鳞疲,可當我...
    茶點故事閱讀 67,917評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著蠕蚜,像睡著了一般尚洽。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上靶累,一...
    開封第一講書人閱讀 51,708評論 1 305
  • 那天腺毫,我揣著相機與錄音癣疟,去河邊找鬼。 笑死潮酒,一個胖子當著我的面吹牛睛挚,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播急黎,決...
    沈念sama閱讀 40,430評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼扎狱,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了叁熔?” 一聲冷哼從身側響起委乌,我...
    開封第一講書人閱讀 39,342評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎荣回,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體戈咳,經(jīng)...
    沈念sama閱讀 45,801評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡心软,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,976評論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了著蛙。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片删铃。...
    茶點故事閱讀 40,115評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖踏堡,靈堂內(nèi)的尸體忽然破棺而出猎唁,到底是詐尸還是另有隱情,我是刑警寧澤顷蟆,帶...
    沈念sama閱讀 35,804評論 5 346
  • 正文 年R本政府宣布诫隅,位于F島的核電站,受9級特大地震影響帐偎,放射性物質發(fā)生泄漏逐纬。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,458評論 3 331
  • 文/蒙蒙 一削樊、第九天 我趴在偏房一處隱蔽的房頂上張望豁生。 院中可真熱鬧,春花似錦漫贞、人聲如沸甸箱。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,008評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽芍殖。三九已至,卻和暖如春仪际,著一層夾襖步出監(jiān)牢的瞬間围小,已是汗流浹背昵骤。 一陣腳步聲響...
    開封第一講書人閱讀 33,135評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留肯适,地道東北人变秦。 一個月前我還...
    沈念sama閱讀 48,365評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像框舔,于是被迫代替她去往敵國和親蹦玫。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,055評論 2 355