Java-基于百度API的圖片文字識(shí)別(支持中文鸥滨,英文和中英文混合)

使用之前需要獲取對(duì)應(yīng)的項(xiàng)目API_KEY终吼,SECRET_KEY威沫,這些參數(shù)在使用API的時(shí)候必須用到,用于生成access_token协饲。

如何獲取這些參數(shù):在百度開(kāi)發(fā)者中心申請(qǐng)一個(gè)“通用文字識(shí)別”項(xiàng)目粥喜,然后就可以獲取到這些參數(shù)凸主。

準(zhǔn)備條件都完成了,現(xiàn)在開(kāi)始進(jìn)行圖像識(shí)別了额湘。

test4j圖片文字識(shí)別教程:http://blog.csdn.net/wsk1103/article/details/54173282

1. 準(zhǔn)備pom文件

<!-- https://mvnrepository.com/artifact/com.alibaba/fastjson -->

<dependency>

<groupId>com.alibaba</groupId>

<artifactId>fastjson</artifactId>

<version>1.2.46</version>

</dependency>

<!-- https://mvnrepository.com/artifact/org.apache.httpcomponents/httpclient -->

<dependency>

<groupId>org.apache.httpcomponents</groupId>

<artifactId>httpclient</artifactId>

<version>4.5.5</version>

</dependency>

1

2

3

4

5

6

7

8

9

10

11

12

2. 獲取access_token

package com.wsk.netty.check;

import org.json.JSONObject;

import java.io.BufferedReader;

import java.io.InputStreamReader;

import java.net.HttpURLConnection;

import java.net.URL;

import java.util.List;

import java.util.Map;

/**

* 獲取token類

*

* @Author : WuShukai

* @Date :2018/2/12 10:04

*/

public class AuthService {

? ? /**

? ? * 獲取權(quán)限token

? ? * @return 返回示例:

? ? * {

? ? * "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",

? ? * "expires_in": 2592000

? ? * }

? ? */

? ? public static String getAuth() {

? ? ? ? // 官網(wǎng)獲取的 API Key 更新為你注冊(cè)的

? ? ? ? String clientId = "**";

? ? ? ? // 官網(wǎng)獲取的 Secret Key 更新為你注冊(cè)的

? ? ? ? String clientSecret = "**";

? ? ? ? return getAuth(clientId, clientSecret);

? ? }

? ? /**

? ? * 獲取API訪問(wèn)token

? ? * 該token有一定的有效期秕铛,需要自行管理,當(dāng)失效時(shí)需重新獲取.

? ? * @param ak - 百度云官網(wǎng)獲取的 API Key

? ? * @param sk - 百度云官網(wǎng)獲取的 Securet Key

? ? * @return assess_token 示例:

? ? * "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"

? ? */

? ? private static String getAuth(String ak, String sk) {

? ? ? ? // 獲取token地址

? ? ? ? String authHost = "https://aip.baidubce.com/oauth/2.0/token?";

? ? ? ? String getAccessTokenUrl = authHost

? ? ? ? ? ? ? ? // 1. grant_type為固定參數(shù)

? ? ? ? ? ? ? ? + "grant_type=client_credentials"

? ? ? ? ? ? ? ? // 2. 官網(wǎng)獲取的 API Key

? ? ? ? ? ? ? ? + "&client_id=" + ak

? ? ? ? ? ? ? ? // 3. 官網(wǎng)獲取的 Secret Key

? ? ? ? ? ? ? ? + "&client_secret=" + sk;

? ? ? ? try {

? ? ? ? ? ? URL realUrl = new URL(getAccessTokenUrl);

? ? ? ? ? ? // 打開(kāi)和URL之間的連接

? ? ? ? ? ? HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();

? ? ? ? ? ? connection.setRequestMethod("GET");

? ? ? ? ? ? connection.connect();

? ? ? ? ? ? // 獲取所有響應(yīng)頭字段

? ? ? ? ? ? Map<String, List<String>> map = connection.getHeaderFields();

? ? ? ? ? ? // 遍歷所有的響應(yīng)頭字段

? ? ? ? ? ? for (String key : map.keySet()) {

? ? ? ? ? ? ? ? System.err.println(key + "--->" + map.get(key));

? ? ? ? ? ? }

? ? ? ? ? ? // 定義 BufferedReader輸入流來(lái)讀取URL的響應(yīng)

? ? ? ? ? ? BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));

? ? ? ? ? ? StringBuilder result = new StringBuilder();

? ? ? ? ? ? String line;

? ? ? ? ? ? while ((line = in.readLine()) != null) {

? ? ? ? ? ? ? ? result.append(line);

? ? ? ? ? ? }

? ? ? ? ? ? /**

? ? ? ? ? ? * 返回結(jié)果示例

? ? ? ? ? ? */

? ? ? ? ? ? System.err.println("result:" + result);

? ? ? ? ? ? JSONObject jsonObject = new JSONObject(result.toString());

? ? ? ? ? ? return jsonObject.getString("access_token");

? ? ? ? } catch (Exception e) {

? ? ? ? ? ? System.err.printf("獲取token失斔跆簟!");

? ? ? ? ? ? e.printStackTrace(System.err);

? ? ? ? }

? ? ? ? return null;

? ? }

? ? public static void main(String[] args) {

? ? ? ? getAuth();

? ? }

}

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

3. 編寫將圖片轉(zhuǎn)化成base64后再轉(zhuǎn)化成urlencode的工具類

package com.wsk.netty.check;

import sun.misc.BASE64Encoder;

import java.io.FileInputStream;

import java.io.IOException;

import java.io.InputStream;

import java.net.URLEncoder;

/**

* 圖片轉(zhuǎn)化base64后再UrlEncode結(jié)果

* @Author : WuShukai

* @Date :2018/2/12 10:43

*/

public class BaseImg64 {

? ? /**

? ? * 將一張本地圖片轉(zhuǎn)化成Base64字符串

? ? * @param imgPath 本地圖片地址

? ? * @return 圖片轉(zhuǎn)化base64后再UrlEncode結(jié)果

? ? */

? ? public static String getImageStrFromPath(String imgPath) {

? ? ? ? InputStream in;

? ? ? ? byte[] data = null;

? ? ? ? // 讀取圖片字節(jié)數(shù)組

? ? ? ? try {

? ? ? ? ? ? in = new FileInputStream(imgPath);

? ? ? ? ? ? data = new byte[in.available()];

? ? ? ? ? ? in.read(data);

? ? ? ? ? ? in.close();

? ? ? ? } catch (IOException e) {

? ? ? ? ? ? e.printStackTrace();

? ? ? ? }

? ? ? ? // 對(duì)字節(jié)數(shù)組Base64編碼

? ? ? ? BASE64Encoder encoder = new BASE64Encoder();

? ? ? ? // 返回Base64編碼過(guò)再URLEncode的字節(jié)數(shù)組字符串

? ? ? ? return URLEncoder.encode(encoder.encode(data));

? ? }

}

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

.

4. 編寫調(diào)用百度API接口的方法鬓梅,獲取識(shí)別結(jié)果

package com.wsk.netty.check;

import org.apache.http.HttpResponse;

import org.apache.http.client.HttpClient;

import org.apache.http.client.methods.HttpPost;

import org.apache.http.entity.StringEntity;

import org.apache.http.impl.client.DefaultHttpClient;

import org.apache.http.util.EntityUtils;

import java.io.File;

import java.io.IOException;

import java.net.URI;

import java.net.URISyntaxException;

/**

* 圖像文字識(shí)別

*

* @Author : WuShukai

* @Date :2018/2/12 10:25

*/

public class Check {

? ? private static final String POST_URL = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic?access_token=" + AuthService.getAuth();

? ? /**

? ? * 識(shí)別本地圖片的文字

? ? *

? ? * @param path 本地圖片地址

? ? * @return 識(shí)別結(jié)果供置,為json格式

? ? * @throws URISyntaxException URI打開(kāi)異常

? ? * @throws IOException? ? ? ? io流異常

? ? */

? ? public static String checkFile(String path) throws URISyntaxException, IOException {

? ? ? ? File file = new File(path);

? ? ? ? if (!file.exists()) {

? ? ? ? ? ? throw new NullPointerException("圖片不存在");

? ? ? ? }

? ? ? ? String image = BaseImg64.getImageStrFromPath(path);

? ? ? ? String param = "image=" + image;

? ? ? ? return post(param);

? ? }

? ? /**

? ? * @param url 圖片url

? ? * @return 識(shí)別結(jié)果,為json格式

? ? */

? ? public static String checkUrl(String url) throws IOException, URISyntaxException {

? ? ? ? String param = "url=" + url;

? ? ? ? return post(param);

? ? }

? ? /**

? ? * 通過(guò)傳遞參數(shù):url和image進(jìn)行文字識(shí)別

? ? *

? ? * @param param 區(qū)分是url還是image識(shí)別

? ? * @return 識(shí)別結(jié)果

? ? * @throws URISyntaxException URI打開(kāi)異常

? ? * @throws IOException? ? ? ? IO流異常

? ? */

? ? private static String post(String param) throws URISyntaxException, IOException {

? ? ? ? //開(kāi)始搭建post請(qǐng)求

? ? ? ? HttpClient httpClient = new DefaultHttpClient();

? ? ? ? HttpPost post = new HttpPost();

? ? ? ? URI url = new URI(POST_URL);

? ? ? ? post.setURI(url);

? ? ? ? //設(shè)置請(qǐng)求頭绽快,請(qǐng)求頭必須為application/x-www-form-urlencoded芥丧,因?yàn)槭莻鬟f一個(gè)很長(zhǎng)的字符串紧阔,不能分段發(fā)送

? ? ? ? post.setHeader("Content-Type", "application/x-www-form-urlencoded");

? ? ? ? StringEntity entity = new StringEntity(param);

? ? ? ? post.setEntity(entity);

? ? ? ? HttpResponse response = httpClient.execute(post);

? ? ? ? System.out.println(response.toString());

? ? ? ? if (response.getStatusLine().getStatusCode() == 200) {

? ? ? ? ? ? String str;

? ? ? ? ? ? try {

? ? ? ? ? ? ? ? /*讀取服務(wù)器返回過(guò)來(lái)的json字符串?dāng)?shù)據(jù)*/

? ? ? ? ? ? ? ? str = EntityUtils.toString(response.getEntity());

? ? ? ? ? ? ? ? System.out.println(str);

? ? ? ? ? ? ? ? return str;

? ? ? ? ? ? } catch (Exception e) {

? ? ? ? ? ? ? ? e.printStackTrace();

? ? ? ? ? ? ? ? return null;

? ? ? ? ? ? }

? ? ? ? }

? ? ? ? return null;

? ? }

? ? public static void main(String[] args) {

? ? ? ? String path = "E:\\find.png";

? ? ? ? try {

? ? ? ? ? ? long now = System.currentTimeMillis();

? ? ? ? ? ? checkFile(path);

? ? ? ? ? ? checkUrl("https://gss3.bdstatic.com/-Po3dSag_xI4khGkpoWK1HF6hhy/baike/c0%3Dbaike80%2C5%2C5%2C80%2C26/sign=08c05c0e8444ebf8797c6c6db890bc4f/fc1f4134970a304e46bfc5f7d2c8a786c9175c19.jpg");

? ? ? ? ? ? System.out.println("耗時(shí):" + (System.currentTimeMillis() - now) / 1000 + "s");

? ? ? ? } catch (URISyntaxException | IOException e) {

? ? ? ? ? ? e.printStackTrace();

? ? ? ? }

? ? }

}

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

.

5. 識(shí)別結(jié)果(僅測(cè)試本地圖片識(shí)別)

中文


結(jié)果:


結(jié)論

這里是使用了Postman進(jìn)行測(cè)試的,用IDEA控制臺(tái)的話续担,返回的json不易讀擅耽。

從這里可以看出,耗時(shí)是1s物遇,雖然識(shí)別率高乖仇,但是結(jié)果還是有那么的一些差距,例如識(shí)別結(jié)果的第五列询兴,只返回了“我是遜尼”乃沙,而原圖片的很大串沒(méi)有識(shí)別出來(lái)。

英文:


結(jié)果:


結(jié)論

單識(shí)別英文的圖片诗舰,效果還是比較滿意的警儒,耗時(shí)短,精準(zhǔn)率高眶根。

中英文結(jié)合:


結(jié)果:


如果你想學(xué)好JAVA這門技術(shù)蜀铲,也想在IT行業(yè)拿高薪,可以參加我們的訓(xùn)練營(yíng)課程属百,選擇最適合自己的課程學(xué)習(xí)记劝,技術(shù)大牛親授,8個(gè)月后诸老,進(jìn)入名企拿高薪隆夯。我們的課程內(nèi)容有:Java工程化、高性能及分布式别伏、高性能蹄衷、深入淺出。高架構(gòu)厘肮。性能調(diào)優(yōu)愧口、Spring,MyBatis类茂,Netty源碼分析和大數(shù)據(jù)等多個(gè)知識(shí)點(diǎn)耍属。如果你想拿高薪的,想學(xué)習(xí)的巩检,想就業(yè)前景好的厚骗,想跟別人競(jìng)爭(zhēng)能取得優(yōu)勢(shì)的,想進(jìn)阿里面試但擔(dān)心面試不過(guò)的兢哭,你都可以來(lái)领舰,q群號(hào)為:180705916 進(jìn)群免費(fèi)領(lǐng)取學(xué)習(xí)資料。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市冲秽,隨后出現(xiàn)的幾起案子舍咖,更是在濱河造成了極大的恐慌,老刑警劉巖锉桑,帶你破解...
    沈念sama閱讀 210,978評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件排霉,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡民轴,警方通過(guò)查閱死者的電腦和手機(jī)攻柠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,954評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)杉武,“玉大人辙诞,你說(shuō)我怎么就攤上這事∏岜В” “怎么了飞涂?”我有些...
    開(kāi)封第一講書人閱讀 156,623評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)祈搜。 經(jīng)常有香客問(wèn)我较店,道長(zhǎng),這世上最難降的妖魔是什么容燕? 我笑而不...
    開(kāi)封第一講書人閱讀 56,324評(píng)論 1 282
  • 正文 為了忘掉前任梁呈,我火速辦了婚禮,結(jié)果婚禮上蘸秘,老公的妹妹穿的比我還像新娘官卡。我一直安慰自己,他們只是感情好醋虏,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,390評(píng)論 5 384
  • 文/花漫 我一把揭開(kāi)白布寻咒。 她就那樣靜靜地躺著,像睡著了一般颈嚼。 火紅的嫁衣襯著肌膚如雪毛秘。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 49,741評(píng)論 1 289
  • 那天阻课,我揣著相機(jī)與錄音叫挟,去河邊找鬼。 笑死限煞,一個(gè)胖子當(dāng)著我的面吹牛抹恳,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播署驻,決...
    沈念sama閱讀 38,892評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼奋献,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼绊序!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起秽荞,我...
    開(kāi)封第一講書人閱讀 37,655評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎抚官,沒(méi)想到半個(gè)月后扬跋,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,104評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡凌节,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年钦听,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片倍奢。...
    茶點(diǎn)故事閱讀 38,569評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡朴上,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出卒煞,到底是詐尸還是另有隱情痪宰,我是刑警寧澤,帶...
    沈念sama閱讀 34,254評(píng)論 4 328
  • 正文 年R本政府宣布畔裕,位于F島的核電站衣撬,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏扮饶。R本人自食惡果不足惜具练,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,834評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望甜无。 院中可真熱鬧扛点,春花似錦、人聲如沸岂丘。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,725評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)元潘。三九已至畔乙,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間翩概,已是汗流浹背牲距。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,950評(píng)論 1 264
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留钥庇,地道東北人牍鞠。 一個(gè)月前我還...
    沈念sama閱讀 46,260評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像评姨,于是被迫代替她去往敵國(guó)和親难述。 傳聞我的和親對(duì)象是個(gè)殘疾皇子萤晴,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,446評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開(kāi)發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見(jiàn)模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn)胁后,斷路器店读,智...
    卡卡羅2017閱讀 134,628評(píng)論 18 139
  • 1. Java基礎(chǔ)部分 基礎(chǔ)部分的順序:基本語(yǔ)法,類相關(guān)的語(yǔ)法攀芯,內(nèi)部類的語(yǔ)法屯断,繼承相關(guān)的語(yǔ)法,異常的語(yǔ)法侣诺,線程的語(yǔ)...
    子非魚(yú)_t_閱讀 31,597評(píng)論 18 399
  • 如何避免失業(yè)危機(jī)殖演?平時(shí)注意增加學(xué)歷、培養(yǎng)跳槽技能年鸳、開(kāi)發(fā)副業(yè) 一是首先從戰(zhàn)略上對(duì)自己的人生要有個(gè)定位趴久,十年后你想過(guò)一...
    思維燈泡閱讀 214評(píng)論 0 0
  • 出租車司機(jī)彼棍,是現(xiàn)代城市中普普通通、而又必不可少的職業(yè)妥箕。 絕大多數(shù)人都坐過(guò)出租滥酥,也許,在短暫的乘車途中畦幢,你還和他們有...
    風(fēng)羽白閱讀 608評(píng)論 0 2