? 一篇文章搞定百度OCR圖片文字識(shí)別API

研究百度OCR的API卓舵,主要是向做對(duì)掃描版的各種PDF進(jìn)行文字識(shí)別并轉(zhuǎn)Word文檔的需求悯仙。

這里用Postman客戶端進(jìn)行測(cè)試和演示信夫。因?yàn)镻ostman是對(duì)各種API操作的最佳入門方式奸攻。一旦在Postman里實(shí)現(xiàn)了正確的調(diào)用稍算,剩下的就只是一鍵生成代碼,和一些細(xì)節(jié)的修改了。

參考百度云官方文檔:文字識(shí)別API參考
下載官方文檔PDF:OCR.zh.pdf

授權(quán)字符串 Access Token

Token字符串永遠(yuǎn)是你使用別人API的第一步惩阶,簡(jiǎn)單說挎狸,就是只有你自己知道的密碼,在你每次向服務(wù)器發(fā)送的請(qǐng)求里面加上這個(gè)字符串琳猫,就相當(dāng)于完成了一次登錄伟叛。

如果沒有Token授權(quán)認(rèn)證私痹,API的訪問可能會(huì)像瀏覽網(wǎng)頁(yè)一樣簡(jiǎn)單脐嫂。

Access Token一般是調(diào)用API最重要也最麻煩的地方了:每個(gè)公司都不一樣,各種設(shè)置安全問題讓你的Token復(fù)雜化紊遵。而百度云的Token账千,真的是麻煩到一定地步了。

參考:百度API的鑒權(quán)認(rèn)證機(jī)制 (建議你不要參考暗膜,因?yàn)樗牧鞒虉D會(huì)先把你鎮(zhèn)住的)

簡(jiǎn)單說匀奏,獲取百度云token字符串的主要流程就是:

  • 創(chuàng)建一個(gè)應(yīng)用,獲得只有自己知道的id和密碼
  • 用POST方式把id和密碼發(fā)給百度的一個(gè)鏈接:
    https://aip.baidubce.com/oauth/2.0/token
  • 其中学搜,需要你向這個(gè)地址傳送三個(gè)參數(shù):
    • grant_type = client_credentials 這個(gè)是固定的
    • client_id = xxx 這個(gè)是你在百度云管理后臺(tái)創(chuàng)建OCR應(yīng)用的時(shí)候娃善,那個(gè)應(yīng)用的API Key
    • client_secret = xxx 這個(gè)是你的應(yīng)用的Secret Key
  • 等待服務(wù)器返還給你一個(gè)包含token字符串的數(shù)據(jù)
  • 記住這個(gè)token字符串,并用來訪問每一次的API

來看看怎么利用Postman操作瑞佩,如下圖所示:


image

填好以后點(diǎn)擊Send發(fā)送聚磺,就會(huì)獲得一個(gè)JSON數(shù)據(jù),如下圖:


image

然后你用你的程序(Python, PHP, Node.js等炬丸,隨便)瘫寝,獲取這個(gè)JSON中的access_token
即可用到正式的API請(qǐng)求中稠炬,做為授權(quán)認(rèn)證焕阿。

正式調(diào)用API: 以"通用文字識(shí)別"為例

API鏈接:https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic

提交方式:POST

調(diào)用方式有兩種:

  • 方式一:直接在URL填寫信息
    直接把API所需的認(rèn)證信息放在URL里是最簡(jiǎn)單最方便的。
  • 方式二:Headers填寫信息方式
    建議忽略這種方式首启,需要填寫很多request的標(biāo)準(zhǔn)headers暮屡,太麻煩。

Headers設(shè)置:

  • Content-Type = application/x-www-form-urlencoded
    只要填這一項(xiàng)就夠了毅桃。

Body數(shù)據(jù)傳送的各項(xiàng)參數(shù):

  • access_token = xxx 把之前獲取到的token字符串填到這里來
  • image = xxx 把圖片轉(zhuǎn)成base64字符串填到這里褒纲,不需要開頭的data:image/png;base64,
  • url = xxx 也可以不用傳圖片而是傳一個(gè)圖片的鏈接。但是百年無效疾嗅,不要用外厂!
  • language_type = CHN_ENG 識(shí)別語(yǔ)言類型。默認(rèn)中英代承。

Body的數(shù)據(jù)如圖所示:


image

然后就可以點(diǎn)Send發(fā)送請(qǐng)求了汁蝶。
成功后,可以得到百度云返回的一個(gè)JSON數(shù)據(jù),類似下圖:


image

返回的是一行一行的識(shí)別字符掖棉。百度云的識(shí)別率是相當(dāng)高的墓律,幾乎100%吧。畢竟是國(guó)內(nèi)本土的機(jī)器訓(xùn)練出來的幔亥。

API常用地址

以下是百度云的OCR常用API地址耻讽,每個(gè)API所需的參數(shù)都差不多,略有不同帕棉。所有的API和地址以及詳細(xì)所需的參數(shù)针肥,參考官方文檔,很簡(jiǎn)單香伴。一個(gè)弄明白了就其他的都明白了慰枕。

API 請(qǐng)求地址 調(diào)用量限制
通用文字識(shí)別 https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic 50000次/天免費(fèi)
通用文字識(shí)別(含位置信息版) https://aip.baidubce.com/rest/2.0/ocr/v1/general 500次/天免費(fèi)
通用文字識(shí)別(高精度版) https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic 500次/天免費(fèi)
通用文字識(shí)別(高精度含位置版) https://aip.baidubce.com/rest/2.0/ocr/v1/accurate 50次/天免費(fèi)
網(wǎng)絡(luò)圖片文字識(shí)別 https://aip.baidubce.com/rest/2.0/ocr/v1/webimage 500次/天免費(fèi)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市即纲,隨后出現(xiàn)的幾起案子具帮,更是在濱河造成了極大的恐慌,老刑警劉巖低斋,帶你破解...
    沈念sama閱讀 216,470評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蜂厅,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡膊畴,警方通過查閱死者的電腦和手機(jī)掘猿,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,393評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來巴比,“玉大人术奖,你說我怎么就攤上這事∏峤剩” “怎么了采记?”我有些...
    開封第一講書人閱讀 162,577評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)政勃。 經(jīng)常有香客問我唧龄,道長(zhǎng),這世上最難降的妖魔是什么奸远? 我笑而不...
    開封第一講書人閱讀 58,176評(píng)論 1 292
  • 正文 為了忘掉前任既棺,我火速辦了婚禮,結(jié)果婚禮上懒叛,老公的妹妹穿的比我還像新娘丸冕。我一直安慰自己,他們只是感情好薛窥,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,189評(píng)論 6 388
  • 文/花漫 我一把揭開白布胖烛。 她就那樣靜靜地躺著眼姐,像睡著了一般。 火紅的嫁衣襯著肌膚如雪佩番。 梳的紋絲不亂的頭發(fā)上众旗,一...
    開封第一講書人閱讀 51,155評(píng)論 1 299
  • 那天,我揣著相機(jī)與錄音趟畏,去河邊找鬼贡歧。 笑死,一個(gè)胖子當(dāng)著我的面吹牛赋秀,可吹牛的內(nèi)容都是我干的利朵。 我是一名探鬼主播,決...
    沈念sama閱讀 40,041評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼沃琅,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼哗咆!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起益眉,我...
    開封第一講書人閱讀 38,903評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎姥份,沒想到半個(gè)月后郭脂,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,319評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡澈歉,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,539評(píng)論 2 332
  • 正文 我和宋清朗相戀三年展鸡,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片埃难。...
    茶點(diǎn)故事閱讀 39,703評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡莹弊,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出涡尘,到底是詐尸還是另有隱情忍弛,我是刑警寧澤,帶...
    沈念sama閱讀 35,417評(píng)論 5 343
  • 正文 年R本政府宣布考抄,位于F島的核電站细疚,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏川梅。R本人自食惡果不足惜疯兼,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,013評(píng)論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望贫途。 院中可真熱鬧吧彪,春花似錦、人聲如沸丢早。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,664評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至啦扬,卻和暖如春中狂,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背扑毡。 一陣腳步聲響...
    開封第一講書人閱讀 32,818評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工胃榕, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人瞄摊。 一個(gè)月前我還...
    沈念sama閱讀 47,711評(píng)論 2 368
  • 正文 我出身青樓勋又,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親换帜。 傳聞我的和親對(duì)象是個(gè)殘疾皇子楔壤,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,601評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 用到的組件 1、通過CocoaPods安裝 2惯驼、第三方類庫(kù)安裝 3蹲嚣、第三方服務(wù) 友盟社會(huì)化分享組件 友盟用戶反饋 ...
    SunnyLeong閱讀 14,613評(píng)論 1 180
  • 每個(gè)人都懷揣著夢(mèng)想,我也不例外祟牲。 一直來都想學(xué)習(xí)攝影隙畜,想成為一名優(yōu)秀的攝影師,想帶著相機(jī)走遍各個(gè)美麗的地方記錄下最...
    b5b3a45b6409閱讀 110評(píng)論 0 0
  • 這個(gè)夏天上的新劇不少,相信學(xué)生黨在暑期里把存貨都補(bǔ)得差不多了吧乡恕,不過不用擔(dān)心言询,9月也不會(huì)劇荒,新片好劇不斷傲宜。 之前...
    閑著嘛閱讀 831評(píng)論 2 3
  • 我們?cè)赑HP中的變量也是如此运杭。不過有幾個(gè)特點(diǎn): 必須要以$開始。如變量x必須要寫成$x 變量的首字母不能以數(shù)字開始...
    幸宇閱讀 252評(píng)論 0 0