文字識別一般都用的tesseract-ocr。
GitHub:https://github.com/tesseract-ocr/tesseract
而Android對應(yīng)的比較推薦的有個tess-two腺占。
GitHub:https://github.com/rmtheis/tess-two
Demo的github地址:https://github.com/wangyisll/TessTwoDemo
先看效果圖
我主要是識別截圖氮块,所以圖片比較規(guī)范捉超,識別率應(yīng)該很高氢伟。
簡介什么都不說了窍仰,直接看簡單的用法吧
首先肯定是引入依賴了
dependencies {
compile 'com.rmtheis:tess-two:6.2.0'
}
簡單的用法其實(shí)就幾行代碼:
TessBaseAPI tessBaseAPI = new TessBaseAPI();
tessBaseAPI.init(DATAPATH, DEFAULT_LANGUAGE);//參數(shù)后面有說明饺藤。
tessBaseAPI.setImage(bitmap);
String text = tessBaseAPI.getUTF8Text();
就這樣簡單的把一個bitmap設(shè)置進(jìn)去塔淤,就能識別到里面的文字并輸出了阱飘。
但是真正用的時候還是遇到了點(diǎn)麻煩斥杜,雖然只是簡單的識別。
主要是tessBaseAPI.init(DATAPATH, DEFAULT_LANGUAGE)這個方法容易出錯沥匈。
先看一下這個方法的源碼吧:
public boolean init(String datapath, String language) {
return init(datapath, language, OEM_DEFAULT);
}
/**
* Initializes the Tesseract engine with the specified language model(s). Returns
* <code>true</code> on success.
*
* @see #init(String, String)
*
* @param datapath the parent directory of tessdata ending in a forward
* slash
* @param language an ISO 639-3 string representing the language(s)
* @param ocrEngineMode the OCR engine mode to be set
* @return <code>true</code> on success
*/
public boolean init(String datapath, String language, int ocrEngineMode) {
if (datapath == null)
throw new IllegalArgumentException("Data path must not be null!");
if (!datapath.endsWith(File.separator))
datapath += File.separator;
File datapathFile = new File(datapath);
if (!datapathFile.exists())
throw new IllegalArgumentException("Data path does not exist!");
File tessdata = new File(datapath + "tessdata");
if (!tessdata.exists() || !tessdata.isDirectory())
throw new IllegalArgumentException("Data path must contain subfolder tessdata!");
//noinspection deprecation
if (ocrEngineMode != OEM_CUBE_ONLY) {
for (String languageCode : language.split("\\+")) {
if (!languageCode.startsWith("~")) {
File datafile = new File(tessdata + File.separator +
languageCode + ".traineddata");
if (!datafile.exists())
throw new IllegalArgumentException("Data file not found at " + datafile);
}
}
}
boolean success = nativeInitOem(mNativeData, datapath, language, ocrEngineMode);
if (success) {
mRecycled = false;
}
return success;
}
注意
從下面的方法中拋出的幾個異痴嵛梗可以看出來,初始化的時候高帖,第一個參數(shù)是個文件夾缰儿,而且這個文件夾中必須有一個tessdata的文件夾;而且這個文件夾中要有個文件叫做 第二個參數(shù).traineddata 散址。具體的可以看下面代碼里的注釋乖阵。這些文件夾和文件沒有的一定要創(chuàng)建好,不然會報(bào)錯预麸。
第二個參數(shù).traineddata 是個什么文件呢瞪浸?
這個是識別用到的語言庫還是文字庫什么的,按那個初始化方法的意思是喲啊放到SD卡中的吏祸∧眨可以在下面的地址下載。我的demo里把這個文件放在了assets中犁罩,啟動的時候復(fù)制到內(nèi)存卡里齐蔽。
https://github.com/tesseract-ocr/tessdata
chi_sim.traineddata應(yīng)該是健體中文吧,我用的是這個床估。中英文都能識別含滴。
代碼
下面是主要代碼:
import android.Manifest;
import android.content.pm.PackageManager;
import android.graphics.Bitmap;
import android.graphics.BitmapFactory;
import android.os.Build;
import android.os.Bundle;
import android.os.Environment;
import android.support.annotation.NonNull;
import android.support.v7.app.AppCompatActivity;
import android.util.Log;
import android.view.View;
import android.widget.Button;
import android.widget.TextView;
import com.googlecode.tesseract.android.TessBaseAPI;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
public class MainActivity extends AppCompatActivity {
private static final String TAG = "MainActivity";
private Button btn;
private TextView tv;
/**
* TessBaseAPI初始化用到的第一個參數(shù),是個目錄丐巫。
*/
private static final String DATAPATH = Environment.getExternalStorageDirectory().getAbsolutePath() + File.separator;
/**
* 在DATAPATH中新建這個目錄谈况,TessBaseAPI初始化要求必須有這個目錄勺美。
*/
private static final String tessdata = DATAPATH + File.separator + "tessdata";
/**
* TessBaseAPI初始化測第二個參數(shù),就是識別庫的名字不要后綴名碑韵。
*/
private static final String DEFAULT_LANGUAGE = "chi_sim";
/**
* assets中的文件名
*/
private static final String DEFAULT_LANGUAGE_NAME = DEFAULT_LANGUAGE + ".traineddata";
/**
* 保存到SD卡中的完整文件名
*/
private static final String LANGUAGE_PATH = tessdata + File.separator + DEFAULT_LANGUAGE_NAME;
/**
* 權(quán)限請求值
*/
private static final int PERMISSION_REQUEST_CODE=0;
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
btn = (Button) findViewById(R.id.btn);
tv = (TextView) findViewById(R.id.tv);
if (Build.VERSION.SDK_INT >= 23) {
if (checkSelfPermission(Manifest.permission.READ_EXTERNAL_STORAGE) != PackageManager.PERMISSION_GRANTED ||
checkSelfPermission(Manifest.permission.WRITE_EXTERNAL_STORAGE) != PackageManager.PERMISSION_GRANTED) {
requestPermissions(new String[]{Manifest.permission.WRITE_EXTERNAL_STORAGE, Manifest.permission.READ_EXTERNAL_STORAGE}, PERMISSION_REQUEST_CODE);
}
}
//Android6.0之前安裝時就能復(fù)制赡茸,6.0之后要先請求權(quán)限,所以6.0以上的這個方法無用祝闻。
copyToSD(LANGUAGE_PATH, DEFAULT_LANGUAGE_NAME);
btn.setOnClickListener(new View.OnClickListener() {
@Override
public void onClick(View v) {
new Thread(new Runnable() {
@Override
public void run() {
Log.i(TAG, "run: kaishi " + System.currentTimeMillis());
Bitmap bitmap = BitmapFactory.decodeResource(getResources(), R.drawable.quanbu);
Log.i(TAG, "run: bitmap " + System.currentTimeMillis());
TessBaseAPI tessBaseAPI = new TessBaseAPI();
tessBaseAPI.init(DATAPATH, DEFAULT_LANGUAGE);
tessBaseAPI.setImage(bitmap);
final String text = tessBaseAPI.getUTF8Text();
Log.i(TAG, "run: text " + System.currentTimeMillis() + text);
runOnUiThread(new Runnable() {
@Override
public void run() {
tv.setText(text);
}
});
tessBaseAPI.end();
}
}).start();
}
});
}
/**
* 將assets中的識別庫復(fù)制到SD卡中
* @param path 要存放在SD卡中的 完整的文件名占卧。這里是"/storage/emulated/0//tessdata/chi_sim.traineddata"
* @param name assets中的文件名 這里是 "chi_sim.traineddata"
*/
public void copyToSD(String path, String name) {
Log.i(TAG, "copyToSD: "+path);
Log.i(TAG, "copyToSD: "+name);
//如果存在就刪掉
File f = new File(path);
if (f.exists()){
f.delete();
}
if (!f.exists()){
File p = new File(f.getParent());
if (!p.exists()){
p.mkdirs();
}
try {
f.createNewFile();
} catch (IOException e) {
e.printStackTrace();
}
}
InputStream is=null;
OutputStream os=null;
try {
is = this.getAssets().open(name);
File file = new File(path);
os = new FileOutputStream(file);
byte[] bytes = new byte[2048];
int len = 0;
while ((len = is.read(bytes)) != -1) {
os.write(bytes, 0, len);
}
os.flush();
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
if (is != null)
is.close();
if (os != null)
os.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
/**
* 請求到權(quán)限后在這里復(fù)制識別庫
* @param requestCode
* @param permissions
* @param grantResults
*/
@Override
public void onRequestPermissionsResult(int requestCode, @NonNull String[] permissions, @NonNull int[] grantResults) {
Log.i(TAG, "onRequestPermissionsResult: "+grantResults[0]);
switch (requestCode){
case PERMISSION_REQUEST_CODE:
if (grantResults.length>0&&grantResults[0]==PackageManager.PERMISSION_GRANTED){
Log.i(TAG, "onRequestPermissionsResult: copy");
copyToSD(LANGUAGE_PATH, DEFAULT_LANGUAGE_NAME);
}
break;
default:
break;
}
}
}