![240](https://cdn2.jianshu.io/assets/default_avatar/9-cceda3cf5072bcdd77e8ca4f21c40998.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
最近在學(xué)習(xí)語音識(shí)別,由于傳統(tǒng)的基于HMM-GMM架構(gòu)的語音識(shí)別具有成熟的理論企蹭、工具鏈白筹,且其一直以來神秘感讓人十分好奇;所以我打算從傳統(tǒng)框架入手學(xué)...
參考 "On Adjusting the Learning Rate in Frequency Domain Echo Cancellation...
參考 《A Hybrid DSP/Deep Learning Approach to Real-Time Full-Band Speech En...
本篇目的: 1)回顧一下 基2-快速傅立葉變換(radix2-FFT) 的理論推導(dǎo)谅摄; 2)以C++語言用最直白的方式實(shí)現(xiàn) 基2-快速傅立葉變換[...
作為學(xué)習(xí)過程徒河,我們盡量少用 庫(kù)函數(shù)。由于我們需要進(jìn)行復(fù)數(shù)乘法送漠、加法運(yùn)算顽照,下面先粗糙地定義一下復(fù)數(shù)運(yùn)算: 我們考慮使用靜態(tài)大小的 FFT 樣本點(diǎn)數(shù)...
小注包括: 1)以個(gè)人視角,分析了作者提出的新框架的動(dòng)機(jī)闽寡,做一些討論代兵; 2)給出了一些關(guān)鍵公式的簡(jiǎn)單證明或說明; 記號(hào)約定: 1)向量用小寫粗體...
參考:Alex Graves,Connectionist Temporal Classification: Labelling Unsegmen...
參考:Alex Graves,Connectionist Temporal Classification: Labelling Unsegmen...
位置編碼 很多網(wǎng)友在討論transfromer的self-attention模塊中位置編碼缺失問題時(shí)爷狈,一般會(huì)優(yōu)先拋出CNN和RNN是位置...