音頻編碼中的聲學(xué)原理（上）

摘要:? ?為了在保證音頻質(zhì)量的前提下提高音頻編碼的壓縮率榨惠，不同的音頻編碼器基于人的發(fā)音模型與感知模型實(shí)現(xiàn)了各自的編碼算法吹散。本文會(huì)介紹幾種音頻編碼器背后的聲學(xué)原理，讓大家對(duì)音頻編碼有一個(gè)整體的認(rèn)識(shí)佑颇。

1牺氨、G711（PCMA/PCMU）

1.1 非均勻量化

人類能忍受的最大聲音（120dB 聲壓級(jí)）的幅度是最微弱聲音（0dB 聲壓級(jí)）的100萬倍狡耻，然而，耳朵不能區(qū)別差別小于1dB的聲音猴凹。

表1 聲壓級(jí)與單位面積上功率的關(guān)系

人耳只能感受到120個(gè)不同的聲壓級(jí)別夷狰，其在100萬幅度范圍內(nèi)呈對(duì)數(shù)分布。換句話說郊霎，響度與聲音幅度的關(guān)系是非線性的沼头。利用人耳的這個(gè)聽覺特性，可以對(duì)聲音幅度進(jìn)行非均勻量化书劝，如果采用均勻量化进倍，每個(gè)采樣需要用12bit才能達(dá)到電話語音質(zhì)量，采用非均勻量化购对，只需要8bit猾昆。

1.2 G711

PCMA采用A定律實(shí)現(xiàn)非均勻量化，PCMU采用μ定律洞斯。如圖1所示毡庆，兩者的曲線幾乎完全相同。從圖中可以直觀地看到烙如，對(duì)于幅度小的信號(hào)么抗，量化間距較小，對(duì)于幅度大的信號(hào)亚铁，量化間距較大（因?yàn)閷?duì)于幅度大的信號(hào)蝇刀，輕微的幅度變化人耳并不能識(shí)別）。

圖1?μ定律與A定律

2徘溢、MPEG-1 音頻編碼

2.1 聽閾

能夠被聽到的最低級(jí)別的聲音定義為聽閾吞琐，能夠?qū)θ说穆犛X結(jié)構(gòu)引起痛苦和傷害的聲音級(jí)別定義為痛閾。

圖2 人的聽覺范圍

圖2的橫坐標(biāo)為頻率范圍（20-20kHz）然爆，縱坐標(biāo)為聲壓級(jí)站粟。從圖2可以看出人的聽閾隨著頻率的變化而變化，最敏感的頻率為3000-3500Hz曾雕，最不敏感的低頻端在20Hz奴烙，最不敏感的高頻段在20000Hz。

2.2 掩蔽效應(yīng)

掩蔽是一些聲音在另一些聲音存在的情況下，變得不被人們區(qū)別甚至不能被人們聽見的現(xiàn)象切诀。譬如在機(jī)場(chǎng)候機(jī)室要仔細(xì)去聽公告揩环，就是公告聲音被掩蔽在了背景聲音下。

圖3 掩蔽信號(hào)導(dǎo)致聽閾移位

如圖3所示幅虑，被掩蔽信號(hào)（Masked Sound）頻率為160Hz丰滑，聲壓級(jí)為39dB，在安靜環(huán)境下倒庵，該信號(hào)能被感知到褒墨，因?yàn)樗穆晧阂呀?jīng)超過聽閾；當(dāng)頻率為250Hz擎宝、聲壓級(jí)為66dB的掩蔽信號(hào)（Masker）存在時(shí)貌亭，掩蔽信號(hào)引起聽閾移位，被掩蔽信號(hào)聲壓級(jí)低于聽閾认臊，導(dǎo)致該信號(hào)無法被感知圃庭。

聲音在時(shí)域也存在掩蔽效應(yīng)，聲音的時(shí)域掩蔽是指一個(gè)瞬時(shí)聲音使其前面或后面的聲音變得不能被人聽見的現(xiàn)象失晴。

圖4 時(shí)域掩蔽的前掩蔽和后掩蔽效應(yīng)

這種掩蔽造成的效應(yīng)是剧腻，在掩蔽聲音前面和后面的聲壓級(jí)都以指數(shù)下降。

2.3 MPEG-1 音頻編碼

MPEG-1是ISO的音頻編碼標(biāo)準(zhǔn)涂屁，一共有三層（Ⅰ书在、Ⅱ、Ⅲ）拆又，高層的編碼復(fù)雜度比低層高儒旬，編碼質(zhì)量也更好，MPEG-1第三層就是MP3編碼器帖族。

圖5 MPEG-1 層Ⅰ編碼器框圖

MPEG-1是一種頻域編碼器栈源，信號(hào)經(jīng)過一組（M=32）帶通濾波器后產(chǎn)生32個(gè)子帶信號(hào)。使用合成濾波器組可將這些子帶信號(hào)合成為幾乎與原始信號(hào)相同的信號(hào)竖般。

圖6 語音信號(hào)的分析和合成濾波器組系統(tǒng)（通道數(shù)M=4）

32個(gè)子帶的帶寬相等甚垦。譬如對(duì)于采樣率為44.1kHz的信號(hào)，對(duì)應(yīng)奈奎斯特頻率為22.05kHz涣雕，每個(gè)子帶的帶寬為22050/32=689Hz艰亮，那么第一個(gè)子帶的帶寬范圍為0-689Hz，第二個(gè)子帶的帶寬范圍為689-1378Hz挣郭，依此類推迄埃。

信號(hào)經(jīng)過短時(shí)傅里葉變換轉(zhuǎn)到頻域后，根據(jù)感知模型計(jì)算掩蔽音兑障。如圖7所示侄非，實(shí)線為頻域下的音頻信號(hào)伶棒，o與x的標(biāo)記代表計(jì)算得出的掩蔽音。

圖7 從信號(hào)中選出遮蔽音

根據(jù)遮蔽音計(jì)算移位后的聽閾彩库，如圖8所示，虛線為全局聽閾先蒋。

圖8 全局聽閾

聽閾可以指導(dǎo)頻譜的量化骇钦。如圖9所示，聲壓級(jí)在聽閾以下的成分可以置為0而不會(huì)對(duì)聲音感知造成影響竞漾。我們知道在量化時(shí)會(huì)引入一個(gè)±1/2LSB（最低有效位）以內(nèi)的量化噪聲眯搭，量化步長(zhǎng)（quantization step size）越大，壓縮率越高业岁，引入的量化噪聲也越大鳞仙。通過保證量化噪聲不超過全局聽閾，就可以選擇一個(gè)盡可能大的量化步長(zhǎng)笔时，而不會(huì)影響音質(zhì)棍好。

圖9 根據(jù)閾值量化頻譜，粗實(shí)線為原始頻譜與量化后頻譜的差值

參考文獻(xiàn)

[1] Steven W.Smith.Digital Signal Processing[M]

[2] Lawrence R.Rabiner, Ronald W.Schafer.Theory and Applications of Digital Speech Processing[M]

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末允耿，一起剝皮案震驚了整個(gè)濱河市借笙，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌较锡，老刑警劉巖业稼，帶你破解...
沈念sama閱讀 219,490評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異蚂蕴，居然都是意外死亡低散，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,581評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門骡楼，熙熙樓的掌柜王于貴愁眉苦臉地迎上來熔号，“玉大人，你說我怎么就攤上這事鸟整】缂危” “怎么了？”我有些...
開封第一講書人閱讀 165,830評(píng)論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵吃嘿，是天一觀的道長(zhǎng)祠乃。經(jīng)常有香客問我，道長(zhǎng)兑燥，這世上最難降的妖魔是什么亮瓷？我笑而不...
開封第一講書人閱讀 58,957評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮降瞳，結(jié)果婚禮上嘱支，老公的妹妹穿的比我還像新娘蚓胸。我一直安慰自己，他們只是感情好除师，可當(dāng)我...
茶點(diǎn)故事閱讀 67,974評(píng)論 6贊 393
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布沛膳。她就那樣靜靜地躺著，像睡著了一般汛聚。火紅的嫁衣襯著肌膚如雪锹安。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,754評(píng)論 1贊 307
城市分裂傳說
那天倚舀，我揣著相機(jī)與錄音叹哭，去河邊找鬼。笑死痕貌，一個(gè)胖子當(dāng)著我的面吹牛风罩，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播舵稠，決...
沈念sama閱讀 40,464評(píng)論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼超升，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了哺徊？” 一聲冷哼從身側(cè)響起廓俭，我...
開封第一講書人閱讀 39,357評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎唉工，沒想到半個(gè)月后研乒，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,847評(píng)論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡淋硝，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,995評(píng)論 3贊 338
?白月光啟示錄
正文我和宋清朗相戀三年雹熬，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片谣膳。...
茶點(diǎn)故事閱讀 40,137評(píng)論 1贊 351
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡竿报，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出继谚，到底是詐尸還是另有隱情烈菌，我是刑警寧澤，帶...
沈念sama閱讀 35,819評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布花履，位于F島的核電站芽世，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏诡壁。R本人自食惡果不足惜济瓢，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,482評(píng)論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望妹卿。院中可真熱鬧旺矾，春花似錦蔑鹦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,023評(píng)論 0贊 22
一樁弒父案嚎朽，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至柬帕，卻和暖如春哟忍，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背雕崩。一陣腳步聲響...
開封第一講書人閱讀 33,149評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留融撞，地道東北人盼铁。一個(gè)月前我還...
沈念sama閱讀 48,409評(píng)論 3贊 373
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像尝偎，于是被迫代替她去往敵國和親饶火。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,086評(píng)論 2贊 355