kaldi安裝編譯

Kaldi是一款基于C++編寫的開源語音識別工具箱崔列。這款工具既可以在Windows下編譯也可以在Linux下編譯腊满。一般建議在linux下開發(fā)钢拧。

一雄妥、下載

打開終端terminal最蕾,輸入命令:

git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden

二、各目錄功能

下載完畢以后老厌,cd kaldi-trunk進去看看下載了一些什么東西瘟则。

其中,./tools枝秤,./src和./egs這三個目錄是比較重要的醋拧。

./tools目錄下面全部都是Kaldi依賴的包。其中主要有:

OpenFST:Weighted Finite State Transducer library,是一個用來構(gòu)造有限狀態(tài)自動機的庫丹壕。我們知道隱馬爾科夫模型就可以看成是一個有限狀態(tài)自動機的庆械。這是最終要的一個包,Kaldi的文檔里面說:If you ever want to understand Kaldi deeply you will need to understand OpenFst.誒菌赖,要學(xué)的好多干奢。

ATLAS:這是一個C++下的線性代數(shù)庫。做機器學(xué)習(xí)自然是需要很多矩陣運算的盏袄。

IRSTLM:這是一個統(tǒng)計語言模型的工具包忿峻。

sph2pipe:這是賓夕法尼亞大學(xué)linguistic data consortium(LDC)開發(fā)的一款處理SPHERE_formatted數(shù)字音頻文件的軟件,它可以將LDC的sph格式的文件轉(zhuǎn)換成其它格式辕羽。

./src目錄存放的是Kaldi的源代碼逛尚。./egs存放的是Kaldi提供的一些例子。我們現(xiàn)在要做的就是編譯安裝Kaldi依賴的各種庫刁愿,然后編譯安裝Kaldi绰寞。

三、Kaldi的編譯

首先安裝依賴包铣口。在./tool目錄下輸入make滤钱,開始編譯,輸入make -j 4命令可以加快速度脑题。

之后切換到./src目錄下件缸,輸入./configure進行配置,然后輸入make depend叔遂,完成之后輸入make進行編譯即可他炊。

(根目錄下,tools目錄已艰,src目錄下下分別有三個INSTALL文件痊末,按照里面的步驟執(zhí)行即可)

四、運行一個例子

Kaldi自帶的例子都放在./egs目錄下哩掺。

其中最簡單的就是yesno這個例子了凿叠。這是一個非常小的數(shù)據(jù)集,每一條記錄都是一系列yes或者no的語音嚼吞,標(biāo)注是由文件名來標(biāo)注的盒件。先運行一下。切換到./egs/yesno/s5目錄下誊薄,運行sudo ./run.sh命令履恩。

經(jīng)過一段時間的訓(xùn)練和測試,可以看到運行結(jié)果呢蔫。

WER為0.00切心§看來這個例子識別的還是挺準(zhǔn)的。

PS:WER(Word Error Rate)是字錯誤率绽昏,是一個衡量語音識別系統(tǒng)的準(zhǔn)確程度的度量协屡。其計算公式是WER=(I+D+S)/N

,其中I代表被插入的單詞個數(shù)全谤,D代表被刪除的單詞個數(shù)肤晓,S代表被替換的單詞個數(shù)。也就是說把識別出來的結(jié)果中认然,多認(rèn)的补憾,少認(rèn)的,認(rèn)錯的全都加起來卷员,除以總單詞數(shù)盈匾。這個數(shù)字當(dāng)然是越低越好。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末毕骡,一起剝皮案震驚了整個濱河市削饵,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌未巫,老刑警劉巖窿撬,帶你破解...
    沈念sama閱讀 212,185評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異叙凡,居然都是意外死亡劈伴,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,445評論 3 385
  • 文/潘曉璐 我一進店門狭姨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來宰啦,“玉大人苏遥,你說我怎么就攤上這事饼拍。” “怎么了田炭?”我有些...
    開封第一講書人閱讀 157,684評論 0 348
  • 文/不壞的土叔 我叫張陵师抄,是天一觀的道長。 經(jīng)常有香客問我教硫,道長叨吮,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,564評論 1 284
  • 正文 為了忘掉前任瞬矩,我火速辦了婚禮茶鉴,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘景用。我一直安慰自己涵叮,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,681評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著拼坎,像睡著了一般怎静。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上舀瓢,一...
    開封第一講書人閱讀 49,874評論 1 290
  • 那天廷雅,我揣著相機與錄音,去河邊找鬼京髓。 笑死航缀,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的堰怨。 我是一名探鬼主播谬盐,決...
    沈念sama閱讀 39,025評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼诚些!你這毒婦竟也來了飞傀?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,761評論 0 268
  • 序言:老撾萬榮一對情侶失蹤诬烹,失蹤者是張志新(化名)和其女友劉穎砸烦,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體绞吁,經(jīng)...
    沈念sama閱讀 44,217評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡幢痘,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,545評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了家破。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片颜说。...
    茶點故事閱讀 38,694評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖汰聋,靈堂內(nèi)的尸體忽然破棺而出门粪,到底是詐尸還是另有隱情,我是刑警寧澤烹困,帶...
    沈念sama閱讀 34,351評論 4 332
  • 正文 年R本政府宣布玄妈,位于F島的核電站,受9級特大地震影響髓梅,放射性物質(zhì)發(fā)生泄漏拟蜻。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,988評論 3 315
  • 文/蒙蒙 一枯饿、第九天 我趴在偏房一處隱蔽的房頂上張望酝锅。 院中可真熱鬧,春花似錦奢方、人聲如沸搔扁。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,778評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽阁谆。三九已至碳抄,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間场绿,已是汗流浹背剖效。 一陣腳步聲響...
    開封第一講書人閱讀 32,007評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留焰盗,地道東北人璧尸。 一個月前我還...
    沈念sama閱讀 46,427評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像熬拒,于是被迫代替她去往敵國和親爷光。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,580評論 2 349

推薦閱讀更多精彩內(nèi)容