最近在學(xué)習(xí)語音識別逞敷,由于傳統(tǒng)的基于HMM-GMM架構(gòu)的語音識別具有成熟的理論咐旧、工具鏈土浸,且其一直以來神秘感讓人十分好奇蚕脏;所以我打算從傳統(tǒng)框架入手學(xué)...
參考 "On Adjusting the Learning Rate in Frequency Domain Echo Cancellation...
參考 《A Hybrid DSP/Deep Learning Approach to Real-Time Full-Band Speech En...
本篇目的: 1)回顧一下 基2-快速傅立葉變換(radix2-FFT) 的理論推導(dǎo)茧吊; 2)以C++語言用最直白的方式實現(xiàn) 基2-快速傅立葉變換[...
作為學(xué)習(xí)過程酒贬,我們盡量少用 庫函數(shù)猾普。由于我們需要進(jìn)行復(fù)數(shù)乘法嫡良、加法運算锰扶,下面先粗糙地定義一下復(fù)數(shù)運算: 我們考慮使用靜態(tài)大小的 FFT 樣本點數(shù)...
小注包括: 1)以個人視角,分析了作者提出的新框架的動機(jī)寝受,做一些討論坷牛; 2)給出了一些關(guān)鍵公式的簡單證明或說明; 記號約定: 1)向量用小寫粗體...
參考:Alex Graves,Connectionist Temporal Classification: Labelling Unsegmen...
參考:Alex Graves,Connectionist Temporal Classification: Labelling Unsegmen...
位置編碼 很多網(wǎng)友在討論transfromer的self-attention模塊中位置編碼缺失問題時很澄,一般會優(yōu)先拋出CNN和RNN是位置...