為了更直觀的理解語音識別的輸入和輸出肴甸,做了timit在線識別的實(shí)驗(yàn)值纱,根據(jù)@bbzz2博主的分享http://m.blog.csdn.net/lijin6249/article/details/51838936,對timit數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn)某宪,步驟相同明吩,其中要感謝kaldi群中魏同學(xué)無私的幫助缰雇。
首先要安裝portaudio皆串;
$cd?~/kaldi-trunk/tools/
$./install_portaudio.sh
然后編譯onlinebin
$cd?~/kaldi-trunk/src/onlinebin/
$make
運(yùn)行./run.sh腳本發(fā)現(xiàn)出現(xiàn)3個(gè)錯(cuò)誤:
1:找不到audio/trans.txt:沒有那個(gè)文件或目錄
解決辦法淹办,在audio文件夾下創(chuàng)建一個(gè)空的trans.txt ?touch trans.txt
2.
WaveData:?expected?RIFF?or?RIFX,?got?NIST
這個(gè)錯(cuò)誤是wav格式問題
kaldi/tools/sph2pipe_v2.5$?vim?0readme.1st
在這個(gè)目錄下打開0readme.1st
里面有編譯步驟
如果你已經(jīng)有
有sph2pipe這個(gè)文件,就不用編譯了恶复,就是綠色這個(gè)
./sph2pipe?-f?rif?test_audio.wav?test_out.wav
test_audio.wav這個(gè)文件就是你的測試文件
要指定目錄