kaldi一些文件解讀

各個文件作用:

1:run.sh  總的運(yùn)行文件屿愚,里面把其他運(yùn)行文件都集成了。

執(zhí)行順序:run.sh >>> path.sh >>> directory(存放訓(xùn)練數(shù)據(jù)的目錄) >>> mono-phone>>>triphone>>>lda_mllt>>>sat>>>quitck

data preparation:

1:generate text,wav.scp,utt2spk,spk2utt ? (將數(shù)據(jù)生成這些文件) (由local/data_prep.sh生成)

text:包含每段發(fā)音的標(biāo)注  sw02001-A_002736-002893?AND?IS

wav.scp: ? ?(extended-filename:實(shí)際的文件名)

sw02001-A?/home/dpovey/kaldi-trunk/tools/sph2pipe_v2.5/sph2pipe?-f?wav?-p?-c?1?/export/corpora3/LDC/LDC97S62/swb1/sw02001.sph?|

utt2spk:? 指明某段發(fā)音是哪個人說的(注意一點(diǎn),說話人編號并不需要與說話人實(shí)際的名字完全一致——只需要大概能夠猜出來就行秸应。)

sw02001-A_000098-001156?2001-A

spk2utt:???...∑俳埂(utt2spk和spk2utt文件中包含的信息是一樣的)

2:produce MFCC features

3:prepare language stuff(build a large lexicon that invovles words in both the training and decoding.)

4:monophone單音素訓(xùn)練

5:tri1三音素訓(xùn)練(以單音素模型為輸入訓(xùn)練上下文相關(guān)的三音素模型), trib2進(jìn)行l(wèi)da_mllt聲學(xué)特征變換敞嗡,trib3進(jìn)行sat自然語言適應(yīng)(運(yùn)用基于特征空間的最大似然線性回歸(fMLLR)進(jìn)行說話人自適應(yīng)訓(xùn)練)颁糟,trib4做quick

LDA-MLLT(Linear Discriminant Analysis – Maximum Likelihood Linear Transform), LDA根據(jù)降維特征向量建立HMM狀態(tài)喉悴。MLLT根據(jù)LDA降維后的特征空間獲得每一個說話人的唯一變換棱貌。MLLT實(shí)際上是說話人的歸一化。?

SAT(Speaker Adaptive Training)箕肃。SAT同樣對說話人和噪聲的歸一化婚脱。

5:DNN

}

2:cmd.sh ?  一般需要修改

export train_cmd=run.pl?#將原來的queue.pl改為run.pl

export decode_cmd="run.pl"#將原來的queue.pl改為run.pl這里的--mem 4G?

export mkgraph_cmd="run.pl"#將原來的queue.pl改為run.pl? 這里的--mem 8G?

export cuda_cmd="run.pl"?#將原來的queue.pl改為run.pl 這里去掉原來的--gpu 1(如果沒有g(shù)pu)

3:path.sh ?(設(shè)置環(huán)境變量)

export KALDI_ROOT=`pwd`/../../..

[ -f $KALDI_ROOT/tools/env.sh ] && . $KALDI_ROOT/tools/env.sh

export PATH=$PWD/utils/:$KALDI_ROOT/tools/openfst/bin:$PWD:$PATH

[ ! -f $KALDI_ROOT/tools/config/common_path.sh ] && echo >&2 "The standard file $KALDI_ROOT/tools/config/common_path.sh is not present -> Exit!" && exit 1

. $KALDI_ROOT/tools/config/common_path.sh

export LC_ALL=C

我們看到是在運(yùn)行run.sh是要用到的環(huán)境變量,在這里先設(shè)置一下.

我們看到先是設(shè)置了KALDI_ROOT,它實(shí)際就是kaldi的源碼的根目錄。

[ -f $KALDI_ROOT/tools/env.sh ] && . $KALDI_ROOT/tools/env.sh?

這句話的意思是如果存在這個環(huán)境變量腳本就執(zhí)行這個腳本障贸,但是我沒有在該路徑下發(fā)現(xiàn)這個腳本错森。

然后是將本目錄下的utils目錄, kaldi根目錄下的tools/openfst/bin目錄 和 本目錄加入到環(huán)境變量PATH中。

然后是判斷如果在kaldi根目錄下的tools/config/common_path.sh不存在篮洁,就打印提示缺少該文件涩维,并且退出。

Kaldi訓(xùn)練腳本針對不同的語料庫袁波,需要重寫數(shù)據(jù)準(zhǔn)備部分瓦阐,腳本一般放在conf、local文件夾里篷牌;

conf放置一些配置文件睡蟋,如提取mfcc、filterbank等參數(shù)的配置枷颊,解碼時的參數(shù)配置?(主要是配置頻率戳杀,將系統(tǒng)采樣頻率與語料庫的采樣頻率設(shè)置為一致)

local一般用來放置處理語料庫的數(shù)據(jù)準(zhǔn)備部分腳本 > 中文識別,應(yīng)該準(zhǔn)備:發(fā)音詞典偷卧、音頻文件對應(yīng)的文本內(nèi)容和一個基本可用的語言模型(解碼時使用)

數(shù)據(jù)訓(xùn)練完后:

exp目錄下:

final.mdl 訓(xùn)練出來的模型

graph_word目錄下:

words.txt ?HCLG.fst ?一個是字典豺瘤,一個是有限狀態(tài)機(jī)(fst:發(fā)音字典,輸入是音素听诸,輸出是詞)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末坐求,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子晌梨,更是在濱河造成了極大的恐慌桥嗤,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,185評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件仔蝌,死亡現(xiàn)場離奇詭異泛领,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)敛惊,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,445評論 3 385
  • 文/潘曉璐 我一進(jìn)店門渊鞋,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人瞧挤,你說我怎么就攤上這事锡宋。” “怎么了特恬?”我有些...
    開封第一講書人閱讀 157,684評論 0 348
  • 文/不壞的土叔 我叫張陵执俩,是天一觀的道長。 經(jīng)常有香客問我癌刽,道長役首,這世上最難降的妖魔是什么尝丐? 我笑而不...
    開封第一講書人閱讀 56,564評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮衡奥,結(jié)果婚禮上爹袁,老公的妹妹穿的比我還像新娘。我一直安慰自己矮固,他們只是感情好呢簸,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,681評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著乏屯,像睡著了一般。 火紅的嫁衣襯著肌膚如雪瘦赫。 梳的紋絲不亂的頭發(fā)上辰晕,一...
    開封第一講書人閱讀 49,874評論 1 290
  • 那天,我揣著相機(jī)與錄音确虱,去河邊找鬼含友。 笑死,一個胖子當(dāng)著我的面吹牛校辩,可吹牛的內(nèi)容都是我干的窘问。 我是一名探鬼主播,決...
    沈念sama閱讀 39,025評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼宜咒,長吁一口氣:“原來是場噩夢啊……” “哼惠赫!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起故黑,我...
    開封第一講書人閱讀 37,761評論 0 268
  • 序言:老撾萬榮一對情侶失蹤儿咱,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后场晶,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體混埠,經(jīng)...
    沈念sama閱讀 44,217評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,545評論 2 327
  • 正文 我和宋清朗相戀三年诗轻,在試婚紗的時候發(fā)現(xiàn)自己被綠了钳宪。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,694評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡扳炬,死狀恐怖吏颖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情鞠柄,我是刑警寧澤侦高,帶...
    沈念sama閱讀 34,351評論 4 332
  • 正文 年R本政府宣布,位于F島的核電站厌杜,受9級特大地震影響奉呛,放射性物質(zhì)發(fā)生泄漏计螺。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,988評論 3 315
  • 文/蒙蒙 一瞧壮、第九天 我趴在偏房一處隱蔽的房頂上張望登馒。 院中可真熱鬧,春花似錦咆槽、人聲如沸陈轿。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,778評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽麦射。三九已至,卻和暖如春灯谣,著一層夾襖步出監(jiān)牢的瞬間潜秋,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,007評論 1 266
  • 我被黑心中介騙來泰國打工胎许, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留峻呛,地道東北人。 一個月前我還...
    沈念sama閱讀 46,427評論 2 360
  • 正文 我出身青樓辜窑,卻偏偏與公主長得像钩述,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子穆碎,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,580評論 2 349

推薦閱讀更多精彩內(nèi)容

  • 1.創(chuàng)建文件夾 !/bin/sh mkdir -m 777 "%%1" 2.創(chuàng)建文件 !/bin/sh touch...
    BigJeffWang閱讀 10,029評論 3 53
  • Ubuntu的發(fā)音 Ubuntu,源于非洲祖魯人和科薩人的語言北秽,發(fā)作 oo-boon-too 的音葡幸。了解發(fā)音是有意...
    螢火蟲de夢閱讀 99,215評論 9 467
  • 最近在學(xué)習(xí)大數(shù)據(jù)技術(shù),朋友叫我直接學(xué)習(xí)Spark贺氓,英雄不問出處蔚叨,菜鳥不問對錯,于是我就開始了Spark學(xué)習(xí)辙培。 為什...
    Plokmijn閱讀 26,511評論 6 26
  • linux資料總章2.1 1.0寫的不好抱歉 但是2.0已經(jīng)改了很多 但是錯誤還是無法避免 以后資料會慢慢更新 大...
    數(shù)據(jù)革命閱讀 12,149評論 2 34
  • 落地伯明翰蔑水,抵達(dá)酒店后,大約是當(dāng)?shù)貢r間10點(diǎn)扬蕊。漫長的飛機(jī)上時間加轉(zhuǎn)機(jī)候機(jī)…已經(jīng)精疲力盡搀别。需要好好吃一頓安慰自己的身...
    微瀾細(xì)語閱讀 423評論 0 1