TF-LSTM窜司、Grid-LSTM

一、簡介

F-LSTM和TF-LSTM主要目的是為了取代CNN作為特征提取的工具蹲坷,來達(dá)到對頻帶間相關(guān)性建模的目的驶乾。F-LSTM和TF-LSTM也是通過類似卷積的方式,通過一個小的滑動窗來捕獲語音的平移不變性循签。

因為使用Peephole方式的LSTM效果更好一些级乐,因此本文提到了LSTM都是使用Peephole連接方式。
通過對比實(shí)驗县匠,Grid-LSTM與TF-LSTM特征提取的效果要比CNN好很多风科,但同時計算速度也慢很多。

T/F-LDNN

二乞旦、T-LSTM

T-LSTM就是原始的LSTM贼穆,沿著時間軸,將每幀輸入LSTM中進(jìn)行預(yù)測兰粉。即上圖橫向故痊。

三、F-LSTM

F-LSTM的形式與T-LSTM類似玖姑,只不過輸入有變化愕秫,其中的
x0 = xt0:F慨菱,x1 = xt1:1+Fx2 = xt2:2+F戴甩,......符喝,
即將每幀語音按照長為 F的滑動窗 進(jìn)行分割,并且 步長為S等恐,輸入到F-LSTM中洲劣。
則特征維度為N的一幀語音被分割為L = (N - F)/S + 1 塊。

形式化表述:

其中:

  • ij :輸入門
  • fj :遺忘門
  • cj:memory cell
  • oj:輸出門
  • mj:LSTM的輸出
F-LSTM單元引入了如下信息:
  • 當(dāng)前時刻輸入xj
  • 上一時刻輸出mt-1
  • 上一時刻memoryct-1

優(yōu)點(diǎn):

  1. 與CNN類似课蔬,也是采用權(quán)值共享減少參數(shù)個數(shù)囱稽;
  2. 可以提取頻帶局部結(jié)構(gòu);
  3. 卷積通過pooling捕獲頻率的平移不變性二跋,F(xiàn)-LSTM能夠?qū)崿F(xiàn)類似max-pooling的作用战惊,并且省去了對pooling操作調(diào)參的步驟;

四扎即、TF-LSTM

手繪示意圖

因為語音的時域和頻域存在相關(guān)性吞获,因此對時頻同時建模來引入時頻之間的相關(guān)性。

形式化表述:
TF-LSTM單元引入了如下信息:
  • 當(dāng)前時刻輸入xt,k
  • 當(dāng)前時刻第k-1個block的輸出mt,k-1
  • 上一時刻第 k 個block的輸出mt-1,k
  • 上一時刻第 k 個block的memoryct-1,k

五谚鄙、Grid-LSTM

TF-LSTM與Grid-LSTM的最大差別就是Grid-LSTM在time-domain和frequency-domain分別各有一個LSTM單元各拷,而TF-LSTM是將time-domain和frequency-domain放在一個LSTM單元里。
Grid-LSTM分別得到時域和頻域的輸出闷营,然后將兩者拼接(concatenate)到一起烤黍。

但是兩個LSTM單元在訓(xùn)練時計算量很大,導(dǎo)致Grid-LSTM訓(xùn)練速度比TF-LSTM慢很多傻盟,但是也可以令gF-LSTM和gT-LSTM的權(quán)值共享速蕊,可以加快LSTM的訓(xùn)練速度,降低計算開銷娘赴。

形式化表述:
Grid-LSTM單元引入了如下信息:
  • 當(dāng)前時刻輸入xt,k
  • 當(dāng)前時刻第k-1個block的輸出mt,k-1
  • 上一時刻第 k 個block的輸出mt-1,k
  • 上一時刻第 k 個block的memoryct-1,k
  • 當(dāng)前時刻第k-1個block的memoryct,k-1
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末规哲,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子诽表,更是在濱河造成了極大的恐慌唉锌,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件竿奏,死亡現(xiàn)場離奇詭異袄简,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)议双,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進(jìn)店門痘番,熙熙樓的掌柜王于貴愁眉苦臉地迎上來捉片,“玉大人平痰,你說我怎么就攤上這事汞舱。” “怎么了宗雇?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵昂芜,是天一觀的道長。 經(jīng)常有香客問我赔蒲,道長泌神,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任舞虱,我火速辦了婚禮欢际,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘矾兜。我一直安慰自己损趋,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布椅寺。 她就那樣靜靜地躺著浑槽,像睡著了一般。 火紅的嫁衣襯著肌膚如雪返帕。 梳的紋絲不亂的頭發(fā)上桐玻,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天,我揣著相機(jī)與錄音荆萤,去河邊找鬼镊靴。 笑死,一個胖子當(dāng)著我的面吹牛观腊,可吹牛的內(nèi)容都是我干的邑闲。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼梧油,長吁一口氣:“原來是場噩夢啊……” “哼苫耸!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起儡陨,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤褪子,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后骗村,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體嫌褪,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年胚股,在試婚紗的時候發(fā)現(xiàn)自己被綠了笼痛。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖缨伊,靈堂內(nèi)的尸體忽然破棺而出摘刑,到底是詐尸還是另有隱情,我是刑警寧澤刻坊,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布枷恕,位于F島的核電站,受9級特大地震影響谭胚,放射性物質(zhì)發(fā)生泄漏徐块。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一灾而、第九天 我趴在偏房一處隱蔽的房頂上張望胡控。 院中可真熱鬧,春花似錦旁趟、人聲如沸铜犬。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽癣猾。三九已至,卻和暖如春余爆,著一層夾襖步出監(jiān)牢的瞬間纷宇,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工蛾方, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留像捶,地道東北人。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓桩砰,卻偏偏與公主長得像拓春,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子亚隅,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內(nèi)容