AISHELL2腳本參數(shù)和生成文件詳解(二)

local/run_gmm.sh

config

  1. nj
  2. stage
  3. gmm-stage

steps/make_mfcc.sh(原腳本是steps/make_mfcc_pitch.sh)

steps/make_fbank.sh(for NN)

config

  1. cmd
    本地運行還是集群
  2. nj =
  3. fbank_config = conf/fbank.conf
    詳情見config文件夾(不同的特征提取方式)
    decode.conf fbank.conf mfcc.conf mfcc_hires.conf online_cmvn.conf pitch.conf
  4. compress = true
  5. write_utt2num_frames

data
data/train/fbank & data/test/fbank

  1. data/train/fbank/feats.scp


    feats.jpg
  2. data/train/fbank/data
    mfcc_data.png

    注:可以看出此文件夾下保存了提取的mfcc盒延。文件是二進制存儲格式演闭,可以通過命令查看宦棺。
copy-feats ark:raw_mfcc_train.1.ark ark,t:-|head
#結(jié)果#
IC0001W0001  [
  51.76422 -24.05947 -11.48542 -14.22171 -21.51131 -6.91844 -15.25735 -9.790284 -12.12508 -6.046162 -5.837749 -9.237104 -3.578245 
  51.71874 -23.59971 -12.43908 -13.2603 -13.77947 -4.04338 -2.339039 -14.1908 -15.68014 -11.11484 -10.56573 -9.136873 -8.903507 
  50.39989 -26.81806 -13.96724 -12.90075 -24.01279 -9.993114 -10.71967 -13.26709 -5.000686 2.416336 -16.94094 -13.0459 -2.325243 
  53.2889 -27.27782 -12.49868 -9.125443 -17.64539 -7.357679 -6.063762 -13.38255 1.314548 3.979588 0.6427386 -13.24636 -2.847327 
  52.21899 -24.979 -9.041672 -4.541141 -14.46169 2.665242 -9.788485 -3.725712 -11.20764 -11.11484 -15.4339 -11.64266 -10.15651 
  52.53733 -24.05947 -9.399294 -8.136672 -14.23429 -0.6890687 -18.41158 -15.46091 -14.76271 -17.10232 -9.360557 -9.437568 -9.530009 
  51.80969 -24.979 -13.21392 -3.282705 -13.77947 -5.161484 -16.83447 -7.908175 -8.158304 -14.07384 -12.04902 -8.936411 2.496104 
  51.49135 -25.89853 -10.53176 -6.428794 -11.60923 -1.807173 -8.54691 -9.581161 -13.1572 -7.403842 -5.837749 -6.129932 -5.875418 
  52.08256 -23.13995 -6.419115 -2.293934 -17.19058 -11.16442 -13.8236 -12.92069 -26.73129 -19.22225 -6.486687 -7.833866 -13.8111 

steps/compute_cmvn_stats.sh

utils/fix_data_dir.sh

steps/train_mono.sh

config

  1. nj=4
  2. cmd=run.pl
  3. scale_opts="--transition-scale=1.0 --acoustic-scale=0.1 --self-loop-scale=0.1"
  4. num_iters=40 # 迭代次數(shù)
  5. max_iter_inc=30 # 迭代30次后不增加高斯數(shù)
  6. totgauss=1000 # 目標(biāo)高斯數(shù)
  7. careful=false
  8. boost_silence=1.0 # Factor by which to boost silence likelihoods in alignment
  9. realign_iters="1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 23 26 29 32 35 38"; #迭代到n次進行re-ali
  10. config= # name of config file.
  11. stage=-4
  12. power=0.25 # exponent to determine number of gaussians from occurrence counts
  13. norm_vars=false # deprecated, prefer --cmvn-opts "--norm-vars=false"
  14. cmvn_opts= # can be used to add extra options to cmvn.
  15. delta_opts= # can be used to add extra options to add-deltas
  • 注:
steps/train_mono.sh --cmd "$train_cmd" --stage 38 --nj $nj \
  data_new/train data/lang exp_new/mono || exit 1;

腳本名字后如果跟著參數(shù)設(shè)置,會覆蓋腳本里的參數(shù)設(shè)置(順序有沒有要求,只要名字和參數(shù)對應(yīng)就行)。“train_cmd”是cmd.sh里的一部分喝滞,很神奇。
第二行是輸入輸出文件膏秫。
gmm-init-mono
gmm-acc-stats-ali
gmm-est
gmm-align-compiled

data

  1. exp_new/mono/ final.mdl
    gmm-copy --binary=false final.mdl final_txt.mdl
  2. exp_new/mono/ final.occ
  3. exp_new/mono/tree
    copy-tree [--binary=false] <tree-in> <tree-out>
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末右遭,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子缤削,更是在濱河造成了極大的恐慌窘哈,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件亭敢,死亡現(xiàn)場離奇詭異滚婉,居然都是意外死亡,警方通過查閱死者的電腦和手機帅刀,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進店門让腹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人扣溺,你說我怎么就攤上這事骇窍。” “怎么了锥余?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵腹纳,是天一觀的道長。 經(jīng)常有香客問我驱犹,道長嘲恍,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任雄驹,我火速辦了婚禮佃牛,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘荠医。我一直安慰自己吁脱,他們只是感情好桑涎,可當(dāng)我...
    茶點故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布彬向。 她就那樣靜靜地躺著,像睡著了一般攻冷。 火紅的嫁衣襯著肌膚如雪娃胆。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天等曼,我揣著相機與錄音里烦,去河邊找鬼凿蒜。 笑死,一個胖子當(dāng)著我的面吹牛胁黑,可吹牛的內(nèi)容都是我干的废封。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼丧蘸,長吁一口氣:“原來是場噩夢啊……” “哼漂洋!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起力喷,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤刽漂,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后弟孟,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體贝咙,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年拂募,在試婚紗的時候發(fā)現(xiàn)自己被綠了庭猩。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,137評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡陈症,死狀恐怖眯娱,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情爬凑,我是刑警寧澤徙缴,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站嘁信,受9級特大地震影響于样,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜潘靖,卻給世界環(huán)境...
    茶點故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一穿剖、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧卦溢,春花似錦糊余、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至宣决,卻和暖如春蘸劈,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背尊沸。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工威沫, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留贤惯,地道東北人。 一個月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓棒掠,卻偏偏與公主長得像孵构,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子烟很,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,086評論 2 355

推薦閱讀更多精彩內(nèi)容