Android JNI開發(fā)之Friso分詞功能

分詞

NDK是Google開發(fā)的一套開發(fā)和編譯工具集,用于Android上JNI編程孤里。通過NDK我們可以在Android上執(zhí)行C/C++代碼妙蔗,進(jìn)行一些CPU密集型的運(yùn)算,比如游戲引擎宿刮,信號(hào)處理,物理仿真等私蕾。本文將通過在Android上調(diào)用Friso庫(kù)實(shí)現(xiàn)分詞算法講解NDK開發(fā)的流程僵缺。

Friso是一個(gè)開源的使用C語(yǔ)言編寫的中文分詞庫(kù),通過在Android上調(diào)用Friso庫(kù)可以實(shí)現(xiàn)中文分詞的功能踩叭。

通過NDK調(diào)用C代碼方式有兩種磕潮, Ndk-build 和 Cmake,其中Ndk-build方式通過Android原生工具包即可實(shí)現(xiàn)容贝,Cmake需要使用外部構(gòu)建工具自脯。我們使用Ndk-build方式調(diào)用C代碼。

  1. 首先在工程根目錄的local.properties中配置ndk和sdk路徑:


    local.properties
  2. 在main目錄下添加jni/friso文件夾斤富,里面存放Friso的源文件:


    目錄結(jié)構(gòu)
  3. 接下來(lái)編譯Friso代碼膏潮,生成對(duì)應(yīng)的So文件。首先配置app的build.gradle文件茂缚,在android模塊的defaultConfig模塊下添加ndk配置戏罢,其中moduleName是編譯模塊的名稱,在Android.mk中會(huì)用到脚囊,下面會(huì)講到龟糕。


    build.gradle
  4. 接下來(lái)配置mk文件,mk文件控制著gradle中指定的nkd module如何編譯悔耘。在src/main/jni目錄下新建兩個(gè)mk文件讲岁,Application.mk和Android.mk。其中Application.mk是一些全局配置衬以,如編譯的ABI缓艳,STL,APP_PLATFORM等看峻。
    Android.mk是編譯某個(gè)module的具體配置阶淘。

    Application.mk

    APP_ABI := armeabi-v7a arm64-v8a
    APP_ALLOW_MISSING_DEPS=false
    APP_STL := gnustl_static
    #APP_STL := stlport_static
    APP_PLATFORM := android-14
    

    在Application.mk中我們指定目標(biāo)ABI包括armeabi-v7a和arm64-v8a兩個(gè)版本,可以在這里添加更多版本互妓。APP_STL使用gnustl_static溪窒,APP_PLATFORM指定為手機(jī)支持的最低版本坤塞,向后兼容。

    Android.mk

    LOCAL_PATH := $(call my-dir)
    
    include $(CLEAR_VARS)
    LOCAL_MODULE := FrisoLib
    
    FILE_LIST := $(wildcard $(LOCAL_PATH)/*.cpp)
    FILE_LIST += $(wildcard $(LOCAL_PATH)/*.c)
    
    FILE_LIST += $(wildcard $(LOCAL_PATH)/friso/src/*.c)
    
    LOCAL_SRC_FILES := $(FILE_LIST:$(LOCAL_PATH)/%=%)
    #LOCAL_SRC_FILES := com_trio_nnpredict_Friso_FrisoWrapper.cpp
    
    LOCAL_LDLIBS := -llog -landroid
    LOCAL_LDLIBS += -ldl   # 添加系統(tǒng)庫(kù)
    LOCAL_LDLIBS += -latomic #  fix error for armeabi: undefined reference to     '__atomic_fetch_add_4'
    include $(BUILD_SHARED_LIBRARY)
    

    Android.mk中通過FILE_LIST指定編譯需要的C和C++源文件澈蚌,通過LOCAL_LDLIBS添加部分用到的系統(tǒng)庫(kù)摹芙,通過include $(BUILD_SHARED_LIBRARY)指定編譯的目標(biāo)是動(dòng)態(tài)庫(kù)⊥鹈椋可以在Android.mk中指定多個(gè)需要編譯的module浮禾,通過include $(CLEAR_VARS)和include $(BUILD_SHARED_LIBRARY)配置每個(gè)module。編譯生成的so文件libFriso.so會(huì)放在src/main/libs路徑下對(duì)應(yīng)的ABI目錄中份汗。

    如果項(xiàng)目中需要用到其他預(yù)編譯好的so文件盈电,如xxx.so,需要把它放在src/main/jniLibs路徑下對(duì)應(yīng)的ABI目錄下裸影。只有通過mk編譯出來(lái)的so文件才放在src/main/libs下挣轨。

    預(yù)編譯so存在時(shí)的目錄結(jié)構(gòu)
  5. 接下來(lái)添加Java和C語(yǔ)言通信的接口军熏。在java目錄下新建一個(gè)FrisoWrapper.java文件轩猩,在里面添加java調(diào)用native代碼的接口:

public class FrisoWrapper {
    static {
        System.loadLibrary("FrisoLib");
    }
    public native String[] getSegedStrings(AssetManager assetManager, String inStr);
}

通過命令行進(jìn)入FrisoWrapper.java所在的目錄,執(zhí)行javah FrisoWrapper荡澎,生成該文件對(duì)應(yīng)的.c文件均践,注意,這里要將入口函數(shù)由.c改為.cpp摩幔,這樣會(huì)使用c++編譯器進(jìn)行編譯彤委,否則會(huì)報(bào)錯(cuò)。javah自動(dòng)生成了native函數(shù)對(duì)應(yīng)的C接口或衡,通過這個(gè)接口實(shí)現(xiàn)java對(duì)C代碼的調(diào)用焦影。

extern "C"告訴C++編譯器按照C代碼的簽名規(guī)則去編譯。JNIEnv *是一個(gè)指向JNI運(yùn)行環(huán)境的指針封断,通過這個(gè)指針訪問JNI函數(shù)斯辰。第一個(gè)jobject指代java中的this對(duì)象,第二個(gè)jobject代表傳入的AssetManager對(duì)象坡疼,jstring代表傳入的String對(duì)象彬呻。

com_jack_friso_FrisoWrapper.h

/* DO NOT EDIT THIS FILE - it is machine generated */
#include <jni.h>
#include <vector>
#include <string>

using namespace std;

#ifndef _Included_com_trio_nnpredict_Friso_FrisoWrapper
#define _Included_com_trio_nnpredict_Friso_FrisoWrapper
#ifdef __cplusplus
extern "C" {
#endif

#include "friso/include/friso.h"
#include "friso/include/friso_API.h"

JNIEXPORT jobjectArray JNICALL Java_com_trio_nnpredict_Friso_FrisoWrapper_getSegedStrings
(JNIEnv *, jobject, jobject, jstring);

#ifdef __cplusplus
}
#endif
#endif

com_jack_friso_FrisoWrapper.cpp

#include <android/asset_manager_jni.h>
#include "com_trio_nnpredict_Friso_FrisoWrapper.h"

using namespace std;

bool isInited = false;
friso_t friso_ = NULL;
friso_config_t config_ = NULL; // 放在最外層保證只需要初始化一次

vector<string> initAndRun(AAssetManager* mgr, fstring query);

jobjectArray make_row(JNIEnv *env, vector<string> results)
{
    jclass stringClass = (*env).FindClass("java/lang/String");
    jobjectArray row = (*env).NewObjectArray(results.size(), stringClass, 0);
    jsize i;

    for (i = 0; i < results.size(); ++i) {
        const char *cstr = (results[i]).c_str();
        (*env).SetObjectArrayElement(row, i, (*env).NewStringUTF(cstr));
    }
    return row;
}

char* jstringTostring(JNIEnv* env, jstring jstr)
{
    char* rtn = NULL;
    jclass clsstring = env->FindClass("java/lang/String");
    jstring strencode = env->NewStringUTF("utf-8");
    jmethodID mid = env->GetMethodID(clsstring, "getBytes", "(Ljava/lang/String;)[B");
    jbyteArray barr= (jbyteArray)env->CallObjectMethod(jstr, mid, strencode);
    jsize alen = env->GetArrayLength(barr);
    jbyte* ba = env->GetByteArrayElements(barr, JNI_FALSE);
    if (alen > 0)
    {
    rtn = (char*)malloc(alen + 1);

    memcpy(rtn, ba, alen);
    rtn[alen] = 0;
    }
    env->ReleaseByteArrayElements(barr, ba, 0);
    return rtn;
}

JNIEXPORT jobjectArray JNICALL Java_com_trio_nnpredict_Friso_FrisoWrapper_getSegedStrings
  (JNIEnv* env, jobject obj, jobject assetManager, jstring query) {
      AAssetManager* mgr = AAssetManager_fromJava(env, assetManager );
      if(mgr==NULL)
      {
          LOGD("AAsertManager is NULL");
      }

     char *nativeString = jstringTostring(env, query);

     LOGD("step 00 query---> %s\n", nativeString);
     /*
      const char* ch = env->GetStringUTFChars(jstr, 0);

      env->ReleaseStringUTFChars(jstr, ch);
      */

      vector<string> results = initAndRun(mgr, (fstring)nativeString);

      jobjectArray jbeatles = make_row(env, results);
      return jbeatles;
}



vector<string> initAndRun(AAssetManager* mgr, fstring query) {
    vector<string> terms;

    if (friso_ == NULL || config_ == NULL) {
        friso_ = friso_new();
        LOGD("step 001");

        config_ = friso_new_config();
        LOGD("step 002");

        string seg_conf_path = "friso/segmenter.config";
        if (1 != friso_init_from_asset_file(friso_, config_, (fstring)(seg_conf_path.c_str()), mgr)) {
            friso_free_config(config_);
            friso_free(friso_);

            LOGD("step 01");

            return terms;
        }
    }

    terms.clear();
    friso_task_t task = friso_new_task();

    friso_set_text(task, query);
    while ((friso_next(friso_, config_, task)) != NULL) {
        string word(task->hits->word);
        LOGD("step 03 %s", word.c_str());
        terms.push_back(word);
    }
    friso_free_task(task);

    return terms;
}

完成這些配置工作后,到j(luò)ni目錄執(zhí)行ndk-build clean柄瑰,ndk-build命令闸氮,如果報(bào)錯(cuò),修改相應(yīng)的代碼錯(cuò)誤教沾,比如一些在Android上不支持的C類型替換成支持的類型之類的蒲跨,會(huì)有很多這種錯(cuò)誤,要慢慢改授翻。一切正常的話或悲,會(huì)在src/main/libs目錄下對(duì)應(yīng)的ABI目錄中生成libFriso.so文件镐作。

調(diào)試通過后,編譯整個(gè)工程隆箩。如果當(dāng)前是一個(gè)module工程该贾,會(huì)在moduleName/build/outputs/aar下生成aar文件,然后就可以在其他項(xiàng)目里引入這個(gè)aar使用了捌臊。引入的方式很簡(jiǎn)單杨蛋,將output_aar_name.aar放到工程的app/libs下,并在build.gradle的dependencies中添加如下語(yǔ)句即可:

compile(name: 'output_aar_name', ext: 'aar')

至此理澎,就可以在app中通過jni調(diào)用Friso庫(kù)實(shí)現(xiàn)中文分詞功能了逞力。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市糠爬,隨后出現(xiàn)的幾起案子寇荧,更是在濱河造成了極大的恐慌,老刑警劉巖执隧,帶你破解...
    沈念sama閱讀 221,576評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件揩抡,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡镀琉,警方通過查閱死者的電腦和手機(jī)峦嗤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,515評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)屋摔,“玉大人烁设,你說(shuō)我怎么就攤上這事〉鍪裕” “怎么了装黑?”我有些...
    開封第一講書人閱讀 168,017評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)弓熏。 經(jīng)常有香客問我恋谭,道長(zhǎng),這世上最難降的妖魔是什么硝烂? 我笑而不...
    開封第一講書人閱讀 59,626評(píng)論 1 296
  • 正文 為了忘掉前任箕别,我火速辦了婚禮,結(jié)果婚禮上滞谢,老公的妹妹穿的比我還像新娘串稀。我一直安慰自己,他們只是感情好狮杨,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,625評(píng)論 6 397
  • 文/花漫 我一把揭開白布母截。 她就那樣靜靜地躺著,像睡著了一般橄教。 火紅的嫁衣襯著肌膚如雪清寇。 梳的紋絲不亂的頭發(fā)上喘漏,一...
    開封第一講書人閱讀 52,255評(píng)論 1 308
  • 那天,我揣著相機(jī)與錄音华烟,去河邊找鬼翩迈。 笑死,一個(gè)胖子當(dāng)著我的面吹牛盔夜,可吹牛的內(nèi)容都是我干的负饲。 我是一名探鬼主播,決...
    沈念sama閱讀 40,825評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼喂链,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼返十!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起椭微,我...
    開封第一講書人閱讀 39,729評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤洞坑,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后蝇率,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體迟杂,經(jīng)...
    沈念sama閱讀 46,271評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,363評(píng)論 3 340
  • 正文 我和宋清朗相戀三年瓢剿,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了逢慌。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片悠轩。...
    茶點(diǎn)故事閱讀 40,498評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡间狂,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出火架,到底是詐尸還是另有隱情鉴象,我是刑警寧澤,帶...
    沈念sama閱讀 36,183評(píng)論 5 350
  • 正文 年R本政府宣布何鸡,位于F島的核電站纺弊,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏骡男。R本人自食惡果不足惜淆游,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,867評(píng)論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望隔盛。 院中可真熱鬧犹菱,春花似錦、人聲如沸吮炕。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,338評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)龙亲。三九已至陕凹,卻和暖如春悍抑,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背杜耙。 一陣腳步聲響...
    開封第一講書人閱讀 33,458評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工搜骡, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人佑女。 一個(gè)月前我還...
    沈念sama閱讀 48,906評(píng)論 3 376
  • 正文 我出身青樓浆兰,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親珊豹。 傳聞我的和親對(duì)象是個(gè)殘疾皇子簸呈,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,507評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容