話說(shuō)之前公司里面一直用到的是 PocketSphinx , 但是在新的項(xiàng)目中有一個(gè)應(yīng)用的場(chǎng)景汇歹,這時(shí)候發(fā)現(xiàn)噪聲影響以及識(shí)別的精確度方面都不是很理想刽射。于是在 Telegram Channel 里面咨詢了下苍鲜,@nshmyrev 回復(fù)建議可以利用 Kaldi DNN 模型,應(yīng)該會(huì)有顯著提升。于是考慮轉(zhuǎn)向研究 Kaldi蚁趁。
首先碰到的一個(gè)問(wèn)題是跨平臺(tái)編譯。網(wǎng)上搜索后發(fā)現(xiàn)泄鹏,被引用最多的一篇文章(下文簡(jiǎn)稱“編譯指南”)是 compile-kaldi-android郎任,但它是基于 Ubuntu 環(huán)境來(lái)編譯的,也看到了編譯 Kaldi 可用的 docker file备籽。但是在Mac環(huán)境下又可以怎樣成功編譯呢舶治?讓我們分解來(lái)看:
1. 配置Android NDK 以及 獨(dú)立的編譯 toolchain
這部分和編譯指南中的大體一致,對(duì)不同的平臺(tái)车猬,沒有NDK的需要相應(yīng)的下載霉猛,并且配置ANDROID_NDK 路徑。
安裝 toolchain :
$ANDROID_NDK/build/tools/make_standalone_toolchain.py --arch arm --api 21 --stl=libc++ --install-dir /tmp/my-android-toolchain
以上命令創(chuàng)建 /tmp/my-android-toolchain/
文件目錄珠闰,并且已經(jīng)包含了 android-21/arch-arm sysroot韩脏,以及32位 ARM 架構(gòu)的工具鏈可執(zhí)行文件等。
將 toolchain 加入到系統(tǒng) PATH中:
export ANDROID_TOOLCHAIN_PATH=/tmp/my-android-toolchain
export PATH=${ANDROID_TOOLCHAIN_PATH}/bin:$PATH
2. 編譯 Android 版本的 OpenBLAS
注:考慮到 gfortran 已經(jīng)是GCC的一部分了铸磅,可以選擇性安裝 gfortran赡矢。
下載源碼:
git clone https://github.com/xianyi/OpenBLAS
選擇 ARMV7 進(jìn)行編譯:
make \
TARGET=ARMV7 \
ONLY_CBLAS=1 \
CC=$ANDROID_TOOLCHAIN_PATH/bin/arm-linux-androideabi-clang \
AR=$ANDROID_TOOLCHAIN_PATH/bin/arm-linux-androideabi-ar \
HOSTCC=gcc \
ARM_SOFTFP_ABI=1 \
-j4
此處與編譯指南中有所不同,如果按它上面的操作阅仔,會(huì)報(bào)出 找不到"crtbegin_so"之類的錯(cuò)誤吹散。
安裝庫(kù)文件
make install NO_SHARED=1 PREFIX=`pwd`/install
3. 編譯 CLAPACK
git clone https://github.com/simonlynen/android_libs.git
cd android_libs/lapack
打開 jni/Android.mk, 注釋掉測(cè)試相關(guān)的編譯指令
# remove some compile instructions related to tests
# LOCAL_MODULE:= testlapack
# LOCAL_SRC_FILES:= testclapack.cpp
# LOCAL_STATIC_LIBRARIES := lapack
# include $(BUILD_SHARED_LIBRARY)
打開 jni/Application.mk
將 APP_STL := gnustl_static
替換為 APP_STL := c++_shared
將 APP_ABI := armeabi armeabi-v7a
替換為 APP_ABI := armeabi-v7a
。armeabi 已經(jīng)不再支持了八酒。
文件最后增加 NDK_TOOLCHAIN_VERSION := clang
編譯
$ANDROID_NDK/ndk-build
編譯完成后會(huì)在 obj/local/armeabi-v7a/
生成庫(kù)文件空民。將生成的庫(kù)文件拷貝到前面你安裝OpenBLAS庫(kù)文件的目錄下(e.g: OpenBlas/install/lib)。Kaldi 將會(huì)在這個(gè)目錄下查找相關(guān)的依賴項(xiàng)羞迷。
4. 編譯 Kaldi
下載源碼
git clone https://github.com/kaldi-asr/kaldi.git
編譯 OpenFST
查看當(dāng)前的kaldi tools/Makefile
后發(fā)現(xiàn)使用的版本是OpenFST-1.6.7界轩。
cd kaldi/tools
wget -T 10 -t 1 http://www.openfst.org/twiki/pub/FST/FstDownload/openfst-1.6.7.tar.gz
tar -zxvf openfst-1.6.7.tar.gz
cd openfst-1.6.7/
CXX=clang++ ./configure --prefix=`pwd` --enable-static --enable-shared --enable-far --enable-ngram-fsts --host=arm-linux-androideabi LIBS="-ldl"
make -j 4
make install
cd ..
ln -s openfst-1.6.5 openfst
編譯源碼
cd ../src
打開 matrix/Makefile
文件,將其中的測(cè)試文件注釋掉(似乎與Clang8.0有關(guān)的bug)衔瓮。
#TESTFILES = matrix-lib-test sparse-matrix-test #matrix-lib-speed-tes
CXX=clang++ ./configure --static --android-incdir=/tmp/my-android-toolchain/sysroot/usr/include/ --host=arm-linux-androideabi --openblas-root=/path/to/OpenBLAS/install
make clean -j
make depend -j
make -j 4
按上述配置已經(jīng)可以生成所有的靜態(tài)鏈接庫(kù) .a 文件了浊猾,它們分別位于 src 下的各個(gè)子目錄中:
.//tree/kaldi-tree.a
.//gmm/kaldi-gmm.a
.//online2/kaldi-online2.a
.//util/kaldi-util.a
.//feat/kaldi-feat.a
.//lm/kaldi-lm.a
.//sgmm2/kaldi-sgmm2.a
.//rnnlm/kaldi-rnnlm.a
.//nnet/kaldi-nnet.a
.//decoder/kaldi-decoder.a
.//nnet2/kaldi-nnet2.a
.//chain/kaldi-chain.a
.//nnet3/kaldi-nnet3.a
.//cudamatrix/kaldi-cudamatrix.a
.//ivector/kaldi-ivector.a
.//kws/kaldi-kws.a
.//hmm/kaldi-hmm.a
.//lat/kaldi-lat.a
.//fstext/kaldi-fstext.a
.//transform/kaldi-transform.a
.//matrix/kaldi-matrix.a
.//base/kaldi-base.a
等等,說(shuō)好的.so
文件在哪呢 热鞍?
P.S.
- 打開 kaldi/src/configure 文件葫慎,將
--android-incdir=*)
android=true;
threaded_math=false;
static_math=true;
static_fst=true;
dynamic_kaldi=false;
MATHLIB='OPENBLAS';
其中的 dynamic_kaldi=false
改為 dynamic_kaldi=true
。
- 更新 configure薇宠,指明庫(kù)類型為
--shared
:
CXX=clang++ ./configure --shared --android-incdir=/tmp/my-android-toolchain/sysroot/usr/include/ --host=arm-linux-androideabi --openblas-root=/path/to/OpenBLAS/install
- 編譯kaldi過(guò)程中除去 debugging symbols, 打開
src/kaldi.mk
修改其中的CXXFLAGS
為:
CXXFLAGS = -std=c++11 -I.. -I$(OPENFSTINC) -O1 $(EXTRA_CXXFLAGS) \
-Wall -Wno-sign-compare -Wno-unused-local-typedefs \
-Wno-deprecated-declarations -Winit-self -Wno-mismatched-tags \
-DKALDI_DOUBLEPRECISION=$(DOUBLE_PRECISION) \
-DHAVE_CXXABI_H -DHAVE_OPENBLAS -DANDROID_BUILD \
-I$(OPENBLASINC) -I$(ANDROIDINC) -ftree-vectorize -mfloat-abi=softfp \
-mfpu=neon -pthread \
-O3 -DNDEBUG
# -g # -O0 -DKALDI_PARANOID
- (已提交PR偷办,最新源碼已修復(fù))
打開src/makefiles/default_rules.mk
,將第4行起按平臺(tái)類型進(jìn)行配置的部分替換為:
ifeq ($(KALDI_FLAVOR), dynamic)
ifdef LIBNAME
LIBFILE = lib$(LIBNAME).so
endif
LDFLAGS += -Wl,-rpath -Wl,$(KALDILIBDIR)
EXTRA_LDLIBS += $(foreach dep,$(ADDLIBS), $(dir $(dep))$(notdir $(basename $(dep))).a)
XDEPENDS =
else
ifdef LIBNAME
LIBFILE = $(LIBNAME).a
endif
XDEPENDS = $(ADDLIBS)
endif
具體原因在于澄港,src下各個(gè)部分編譯動(dòng)態(tài)鏈接庫(kù)時(shí)需要區(qū)分不同的平臺(tái)類型椒涯,而 Makefile 中直接根據(jù) shell 環(huán)境下 uname
返回的值來(lái)判定的。而這在跨平臺(tái)編譯時(shí)是不夠充分的回梧,此時(shí)的 host=arm-linux-androideabi
废岂,不能以Mac下的動(dòng)態(tài)鏈接庫(kù)的條件直接判定铡溪,否則會(huì)出現(xiàn)動(dòng)態(tài)鏈接庫(kù)不匹配的問(wèn)題 :
clang80++: error: linker command failed with exit code 1 (use -v to see invocation)
make[1]: *** [libkaldi-matrix.dylib] Error 1
- 重新編譯即可,生成的so文件可在
src/lib/
下找到泪喊。
make -j clean depend; make -j 4
5. 后記
這次解決跨平臺(tái)的編譯問(wèn)題將近花了4天的時(shí)間棕硫,故記錄整個(gè)過(guò)程,希望對(duì)后來(lái)嘗試編譯的人有所啟示袒啼。在這期間非常感謝 compile-kaldi-android的指引, @funcwj 在微信上的交流哈扮, google group kaldi-help
論壇上面大家的熱心回復(fù)。