音頻編碼中的聲學(xué)原理(下)

摘要:? ?上文介紹了G711與MPEG-1的聲學(xué)原理鸭限,這類編碼器基于人耳感知模型,盡管適用于語音和音樂信號里覆,但主要目的是編碼出高質(zhì)量的音頻娛樂信號,如器樂和聲樂信號缆瓣。本文將介紹另一類音頻編碼器,它們基于發(fā)聲模型弓坞,用于編碼語音信號。

1戚扳、發(fā)音模型

1.1 濁音與清音

濁音產(chǎn)生的機(jī)理如下:

當(dāng)聲帶(Vocal Cords)閉合時,從肺部排出的空氣在聲帶后面形成壓力帽借,直到聲帶最終被分開超歌。當(dāng)空氣從分開的聲帶中流出時,根據(jù)貝怒利定律(流體系統(tǒng)中巍举,流速越快,流體產(chǎn)生的壓力越小)梦皮,空氣壓力下降,導(dǎo)致聲帶再次閉合剑肯。聲帶按準(zhǔn)周期進(jìn)行打開和關(guān)閉的循環(huán)观堂,形成了準(zhǔn)周期的脈沖。通過咽型将、口和鼻道時,這些脈沖被頻率整形七兜。

圖1 聲帶橫截面簡圖

清音是通過聲道的某些位置形成部分收縮,強(qiáng)制空氣以足夠高的速度通過收縮點產(chǎn)生擾動而產(chǎn)生的腕铸。這會產(chǎn)生類似寬帶噪聲的聲音(如單詞see)。

如圖2所示狠裹,濁音可以很容易通過波形的準(zhǔn)周期特性識別,這些區(qū)域標(biāo)為V涛菠;清音識別比較困難,它們很容易和背景信號混淆俗冻,這些區(qū)域標(biāo)為U。

圖2 語音波形琅关,濁音(V)讥蔽、清音(U)和靜音(S)

濁音波形中重復(fù)波形的局部時間也被稱為基音周期。如圖3所示冶伞,矩形內(nèi)的波形不斷重復(fù),每個矩形持續(xù)的時間就是基音周期碰缔。

圖3 語音波形中估計出基音周期


1.2 聲門脈沖模型

對于濁音戳护,聲門會影響產(chǎn)生的準(zhǔn)周期信號的波形金抡。

聲門脈沖的建模如圖4所示,通過調(diào)整脈沖長度可以適應(yīng)不同的基音周期并建模不同的聲門開合比率梗肝。

圖4 單聲門脈沖模型

對圖4的脈沖模型進(jìn)行傅里葉變換后的頻率響應(yīng)如圖5所示,可以看出聲門脈沖本身有低通特性禀晓,高頻部分會被削弱。

圖5 單聲門脈沖的傅里葉變換

1.3 聲道模型

對聲道模型主要考慮聲道面積坝锰、聲波在聲道中的反射和聲波在聲門和嘴唇的損失。

1.4 輻射模型

對嘴唇的輻射建馁旃裕可以假設(shè)輻射面處于一個無限延伸的平面障礙中,如圖6所示帽芽。

圖6 無限平面擋板地輻射

1.5 完整模型

圖7 語音發(fā)聲模型

2翔冀、線性預(yù)測編碼(LPC)

根據(jù)語音的發(fā)聲模型,只要提供準(zhǔn)確的語音參數(shù)搬瑰,就能還原出語音波形。

圖8給出了發(fā)聲模型的一種簡化形式跌捆。濾波器H(z)不僅包含了聲道共振作用,也包含唇部輻射作用佩厚,在濁音情況下還包含了聲門脈沖形狀的譜效應(yīng)说订,H(z)被稱為聲道系統(tǒng)函數(shù)。對于濁音陶冷,這個系統(tǒng)受一個準(zhǔn)周期脈沖串激勵,對于清音埂伦,系統(tǒng)受隨機(jī)噪聲序列激勵。

圖8 簡化的系統(tǒng)語音產(chǎn)生模型框圖

該模型需要的參數(shù)有:

? ? 1膊毁、濁音/清音分類

????2、濁音的基音周期

? ? 3婚温、增益參數(shù)G

? ? 4、H(z)的濾波器系數(shù) {{a_{k}, k=1,2,...,p }}

濁音/清音分類和基音周期檢測有其他方法估計栅螟,不在這里討論。

LPC用線性預(yù)測分析方法力图,通過分析語音信號得到H(z)的濾波器系數(shù) {{a_{k}, k=1,2,...,p }} 和增益參數(shù)G。由于語音信號的時變性吃媒,分析程序是取一小段語音幀(10-30ms)來估計濾波器系數(shù)(語音有短時平穩(wěn)的性質(zhì))。該分析程序的目的是找出一組濾波器系數(shù)a_{k} 晓折,使得預(yù)測誤差的均方差最小。

模型輸出的語音采樣s[n]可以用如下的差分方程來表示:

s[n]=\sum_{k=1}^pa_{k}s[n-k]+e[n]

其中加權(quán)項\sum_{k=1}^pa_{k}s[n-k]為預(yù)測信號漾月,e[n]為預(yù)測誤差:

e[n]=s[n]-\sum_{k=1}^pa_{k}s[n-k]

e[n]的均方預(yù)測誤差(MSE)定義為:

\varepsilon_{n} =\sum_{m}^\  e^2[m]= \sum_{m}^\ (s[m]-\sum_{k=1}^pa_{k}s[m-k]  )^2

為了求得使\varepsilon_{n}最小的各個a_{k} 值,令?\varepsilon _{n}/ ?a _{k}=0, i = 1, 2, . . . , p胃珍,求偏導(dǎo)后可得方程組:\sum_{m}^\ s[m-i]s[m]=\sum_{k=1}^p a_{k}\sum_{m}^\ s[m-i]s[m-k], 1\leq i \leq p

根據(jù)該方程組,最小均方誤差可以表示為:

\varepsilon_{n} =\sum_{m}^\  s^2[m] - \sum_{k=1}^pa_{k}\sum_{m}^ \ s[m]s[m-k]

寫成自相關(guān)形式:

\sum_{k=1}^pa_{k}R[|i-k|]=R[i], a\leq i \leq p

方程組可以用托普利茲(Toeplize)矩陣(它是對稱的吩蔑,而且任意一條對角線上的所有元素相等)表示:

對矩陣進(jìn)行求解可算出濾波器系數(shù)a_{k}填抬。

參考文獻(xiàn)

[1] Steven W.Smith.Digital Signal Processing[M]

[2] Lawrence R.Rabiner, Ronald W.Schafer.Theory and Applications of Digital Speech Processing[M]

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市飒责,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌宏蛉,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件揍堰,死亡現(xiàn)場離奇詭異鹏浅,居然都是意外死亡隐砸,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來继控,“玉大人,你說我怎么就攤上這事霹崎。” “怎么了尾菇?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵囚枪,是天一觀的道長。 經(jīng)常有香客問我链沼,道長救湖,這世上最難降的妖魔是什么熊经? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任抵乓,我火速辦了婚禮指郁,結(jié)果婚禮上罗售,老公的妹妹穿的比我還像新娘奖恰。我一直安慰自己,他們只是感情好房官,可當(dāng)我...
    茶點故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布续滋。 她就那樣靜靜地躺著,像睡著了一般疲酌。 火紅的嫁衣襯著肌膚如雪了袁。 梳的紋絲不亂的頭發(fā)上湿颅,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天,我揣著相機(jī)與錄音油航,去河邊找鬼。 笑死谊囚,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的镰踏。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼奠伪,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了绊率?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤佣盒,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后肥惭,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡蜜葱,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年牵囤,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片滞伟。...
    茶點故事閱讀 40,137評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖梆奈,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情亩钟,我是刑警寧澤鳖轰,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布扶镀,位于F島的核電站,受9級特大地震影響臭觉,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蝠筑,卻給世界環(huán)境...
    茶點故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望菱肖。 院中可真熱鬧旭从,春花似錦、人聲如沸和悦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽褒繁。三九已至,卻和暖如春棒坏,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背遭笋。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工坝冕, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留瓦呼,地道東北人。 一個月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓央串,卻偏偏與公主長得像,于是被迫代替她去往敵國和親稳摄。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,086評論 2 355

推薦閱讀更多精彩內(nèi)容

  • [TOC] 歌聲合成原理 歌唱產(chǎn)生的音樂成為歌聲秩命。歌唱更注意著重于通過橫膈膜和腹部甚至下腹部肌肉來調(diào)整呼吸, 從而...
    纏禪可禪閱讀 2,080評論 0 0
  • 第三章 語音信號特征分析 語音合成音質(zhì)的好壞弃锐,語音識別率的高低,都取決于對語音信號分析的準(zhǔn)確度和精度霹菊。例如,利用線...
    鍋鍋Iris閱讀 10,241評論 3 8
  • 女性基音頻率高旋廷,基音周期(基音頻率)是由聲帶張開閉合的周期所決定的,只有濁音的產(chǎn)生與聲帶的閉合開張相關(guān)饶碘,故要檢測基...
    dingtom閱讀 3,047評論 0 0
  • 語音信號特征:能量 基音頻率 共振峰 處理階段:數(shù)字化預(yù)處理端點檢測提取語音特征、計算 能量分短時能量和短時平...
    三木仔閱讀 1,211評論 0 1
  • 摘要: 為了在保證音頻質(zhì)量的前提下提高音頻編碼的壓縮率瑟曲,不同的音頻編碼器基于人的發(fā)音模型與感知模型實現(xiàn)了各自的編碼...
    myroncml閱讀 1,495評論 0 0