語音識別Viterbi解碼

語音識別解碼過程使用的是Viterbi算法救恨，本質上是一種動態(tài)規(guī)劃算法陷揪，能夠得到全局最優(yōu)解王滤。為了進一步減少計算復雜度腿准，引用了Beam Search 算法际起，可以在損失微小性能的條件下提高解碼速度，Beam Search無法保證全局最優(yōu)解吐葱。

Viterbi解碼算法

Viterbi解碼

如果從起點到終點有一條最終路徑街望，那么這條路徑子路徑也是從起點到相應時刻點的最優(yōu)路徑。如上圖弟跑，紅線是一條從起點到終點的最優(yōu)路徑灾前，那么從起點到時刻4的紅線部分也是該時間段的最優(yōu)路徑。換句話說孟辑，任一時刻哎甲，只需記錄到該時刻所有狀態(tài)的最優(yōu)路徑即可蔫敲，以時刻4為例，在時刻4炭玫，只需記錄時刻4上經(jīng)過三個狀態(tài)S1,S2,S3的最優(yōu)路徑即可奈嘿，也就是只需要記錄三條路徑，接著到時刻5吞加，時刻5的S3狀態(tài)有兩條路徑經(jīng)過裙犹，取其中最優(yōu)路徑，時刻5的S2衔憨、S1狀態(tài)類似叶圃，也就是說到了時刻5，仍然只需要記錄三條路徑即可践图。
所以每一時刻需要做兩次循環(huán)盗似，外層循環(huán)現(xiàn)在時刻所有狀態(tài)，內層循環(huán)現(xiàn)在時刻某一狀態(tài)到下一時刻所有狀態(tài)平项。時間復雜度 $N^2$ 赫舒，所有時間段時間復雜度 $TN^2$ 。上圖中闽瓢，N=3接癌，實際大規(guī)模語音識別中任一時刻的狀態(tài)可能很大，比如5000個扣讼，這樣即使使用了維特比缺猛，時間復雜度還是太大，實際中為了解決這個問題椭符，引入了Beam Search算法

Beam Search 算法

Viterbi解碼中涉及到現(xiàn)在時刻state數(shù)目以及下一時刻state數(shù)目荔燎，如果我們想要提高解碼速度，需要對這兩個數(shù)值都做縮減销钝。
實際做法是設置閾值有咨，減少語音識別中現(xiàn)在時刻以及下一時刻狀態(tài)數(shù)目，具體做法是：

對所有狀態(tài)排序蒸健，最優(yōu)狀態(tài)放最前面座享，最優(yōu)狀態(tài)得分=best_weight
設置一個beam，設置閾值1=cur_cutoff似忧，cur_cutoff=best_weight+beam渣叛，所有得分在cur_cutoff以內的，保留盯捌，反之丟棄淳衙，現(xiàn)在時刻的state數(shù)目減少。
計算到下一時刻的最優(yōu)路徑得分new_weight。
設置一個adaptive_beam, 設置閾值2=next_cutoff箫攀，next_cutoff=new_weight+adaptive_beam肠牲，所有得分在next_cutoff以內的，保留匠童，反之丟棄埂材，下一時刻的state數(shù)目減少。

kaldi實際解碼過程中汤求，cur_cutoff俏险、next_cutoff這兩個閾值是計算出來，涉及到的傳入?yún)?shù)包括：config_.beam扬绪，config_.beam_delta竖独，config_.max_active，config_.min_active挤牛。之所以引入max_active莹痢，min_active是為了保證任意時刻的state數(shù)目在[min_active，max_active]之間墓赴，單純的只用beam竞膳，有可能會導致某一時刻state數(shù)目過大或者過小。

具體Kaldi代碼解析見Kaldi 解碼代碼解析

Reference

http://kaldi-asr.org/doc/index.html

注1: 安德魯·維特比（Andrew J. Viterbi）诫硕，CDMA之父坦辟，IEEE Fellow ，高通公司創(chuàng)始人之一章办，高通首席科學家锉走。他開發(fā)了卷積碼編碼的最大似然算法

最后編輯于：2019.03.13 17:34:32

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市藕届，隨后出現(xiàn)的幾起案子挪蹭，更是在濱河造成了極大的恐慌，老刑警劉巖休偶，帶你破解...
沈念sama閱讀 222,681評論 6贊 517
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件梁厉，死亡現(xiàn)場離奇詭異，居然都是意外死亡椅贱，警方通過查閱死者的電腦和手機懂算，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,205評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來庇麦，“玉大人，你說我怎么就攤上這事喜德∩介希” “怎么了？”我有些...
開封第一講書人閱讀 169,421評論 0贊 362
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵舍悯，是天一觀的道長航棱。經(jīng)常有香客問我睡雇，道長，這世上最難降的妖魔是什么饮醇？我笑而不...
開封第一講書人閱讀 60,114評論 1贊 300
?港島之戀（遺憾婚禮）
正文為了忘掉前任它抱，我火速辦了婚禮，結果婚禮上朴艰，老公的妹妹穿的比我還像新娘观蓄。我一直安慰自己，他們只是感情好祠墅，可當我...
茶點故事閱讀 69,116評論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布侮穿。她就那樣靜靜地躺著，像睡著了一般毁嗦。火紅的嫁衣襯著肌膚如雪亲茅。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 52,713評論 1贊 312
城市分裂傳說
那天狗准，我揣著相機與錄音克锣，去河邊找鬼。笑死腔长，一個胖子當著我的面吹牛袭祟，可吹牛的內容都是我干的。我是一名探鬼主播饼酿，決...
沈念sama閱讀 41,170評論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼榕酒，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了故俐？” 一聲冷哼從身側響起想鹰，我...
開封第一講書人閱讀 40,116評論 0贊 277
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎药版，沒想到半個月后辑舷，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 46,651評論 1贊 320
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡槽片，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 38,714評論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年何缓，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片还栓。...
茶點故事閱讀 40,865評論 1贊 353
活死人
序言：一個原本活蹦亂跳的男人離奇死亡碌廓，死狀恐怖，靈堂內的尸體忽然破棺而出剩盒，到底是詐尸還是另有隱情谷婆，我是刑警寧澤，帶...
沈念sama閱讀 36,527評論 5贊 351
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站纪挎，受9級特大地震影響期贫，放射性物質發(fā)生泄漏。R本人自食惡果不足惜异袄，卻給世界環(huán)境...
茶點故事閱讀 42,211評論 3贊 336
男人毒藥：我在死后第九天來索命
文/蒙蒙一通砍、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧烤蜕，春花似錦封孙、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,699評論 0贊 25
一樁弒父案敛瓷，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至斑匪，卻和暖如春呐籽，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背蚀瘸。一陣腳步聲響...
開封第一講書人閱讀 33,814評論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工狡蝶，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人贮勃。一個月前我還...
沈念sama閱讀 49,299評論 3贊 379
代替公主和親
正文我出身青樓贪惹，卻偏偏與公主長得像，于是被迫代替她去往敵國和親寂嘉。傳聞我的和親對象是個殘疾皇子奏瞬，可洞房花燭夜當晚...
茶點故事閱讀 45,870評論 2贊 361

語音識別Viterbi解碼

Viterbi解碼算法

Beam Search 算法

Reference

推薦閱讀更多精彩內容