寫在前面
如果大家對(duì)音視頻相關(guān)知識(shí)感興趣剧罩,可以訂閱我的專題 視頻播放器和音視頻基礎(chǔ)知識(shí)。
正文
掩蔽效應(yīng)概念
所謂的掩蔽效應(yīng)是指: 一個(gè)較弱的聲音的聽覺感受被另一個(gè)較強(qiáng)的聲音影響的現(xiàn)象,我們就稱之為人耳的“掩蔽效應(yīng)”伯复「爿海“掩蔽效應(yīng)”在實(shí)際聲學(xué)應(yīng)用中有很重要的作用。
我們假設(shè)安靜的環(huán)境下疚鲤,聽清楚聲音A的閾值為30dB锥累,若此時(shí)又能同時(shí)聽見聲音B,這時(shí)由于B的影響集歇,使得 A的閾值提高到了40dB桶略,即比原來提高了10dB。此時(shí),我們就稱B為掩蔽聲际歼,A為被掩蔽聲惶翻。被掩蔽聲聽閾提高的分貝數(shù)稱為掩蔽量,即上述10dB為掩蔽量蹬挺,40dB稱為掩蔽閾维贺。
掩蔽可分成頻域掩蔽和時(shí)域掩蔽。
頻域掩蔽
事實(shí)上巴帮,掩蔽效應(yīng)并不僅僅是個(gè)音量問題溯泣,因?yàn)楫?dāng)掩蔽音與被掩蔽音的頻率不相同的時(shí)候,掩蔽作用并不那么嚴(yán)重榕茧。但一個(gè)響亮的純音很容易就把另一個(gè)頻率更高的純音給掩蔽掉垃沦。
一個(gè)強(qiáng)純音會(huì)掩蔽在其附近同時(shí)發(fā)聲的弱純音,這種特性稱為頻域掩蔽用押,也稱同時(shí)掩蔽(simultaneous masking)肢簿,如圖1所示。
從圖1中可以看到蜻拨,聲音頻率在300 Hz附近池充、聲強(qiáng)約為60 dB的聲音掩蔽了聲音頻率在150 Hz附近、聲強(qiáng)約為40 db的聲音缎讼。又如收夸,一個(gè)聲強(qiáng)為60 dB、頻率為1000 Hz的純音血崭,另外還有一個(gè)1100 Hz的純音卧惜,前者比后者高18 dB,在這種情況下我們的耳朵就只能聽到那個(gè)1000 Hz的強(qiáng)音夹纫。如果有一個(gè)1000 Hz的純音和一個(gè)聲強(qiáng)比它低18 dB的2000 Hz的純音咽瓷,那么我們的耳朵將會(huì)同時(shí)聽到這兩個(gè)聲音。要想讓2000 Hz的純音也聽不到舰讹,則需要把它降到比1000 Hz的純音低45 dB茅姜。一般來說,弱純音離強(qiáng)純音越近就越容易被掩蔽月匣。
在圖2中的一組曲線分別表示頻率為250 Hz,1 kHz和4 kHz純音的掩蔽效應(yīng)桶错,它們的聲強(qiáng)均為60 dB。從圖2中可以看到:
1)在250 Hz胀蛮,1 kHz和4 kHz純音附近院刁,對(duì)其他純音的掩蔽效果最明顯。
2)低頻純音可以有效地掩蔽高頻純音粪狼,但高頻純音對(duì)低頻純音的掩蔽作用則不明顯退腥。
由于聲音頻率與掩蔽曲線不是線性關(guān)系任岸,為從感知上來統(tǒng)一度量聲音頻率,引入了“臨界頻帶(critical band)”的概念狡刘。通常認(rèn)為享潜,在20 Hz到16 kHz范圍內(nèi)有24個(gè)臨界頻帶,臨界頻帶的單位叫Bark(巴克)嗅蔬,
1 Bark = 一個(gè)臨界頻帶的寬度
f(頻率)< 500 Hz的情況下剑按,1 Bark≈f/100
f(頻率) > 500 Hz的情況下,1Bark≈9 + 4log(f/1000)
以上我們討論了響度澜术、音高和掩蔽效應(yīng)艺蝴,尤其是人的主觀感覺。其中掩蔽效應(yīng)尤為重要鸟废,它是心理聲學(xué)模型的基礎(chǔ)猜敢。
時(shí)域掩蔽
除了同時(shí)發(fā)出的聲音之間有掩蔽現(xiàn)象之外,在時(shí)間上相鄰的聲音之間也有掩蔽現(xiàn)象盒延,并且稱為時(shí)域掩蔽缩擂。時(shí)域掩蔽又分為超前掩蔽(pre-masking)和滯后掩蔽(post-masking),如圖3所示添寺。產(chǎn)生時(shí)域掩蔽的主要原因是人的大腦處理信息需要花費(fèi)一定的時(shí)間胯盯。一般來說,超前掩蔽很短畦贸,只有大約5~20 ms陨闹,而滯后掩蔽可以持續(xù)50~200 ms。
除了頻域掩蔽和時(shí)域掩蔽外薄坏,還存在一種被稱之為“時(shí)間掩蔽”的效應(yīng)趋厉。
同步掩蔽效應(yīng)和不同頻率聲音的頻率和相對(duì)音量有關(guān),而時(shí)間掩蔽則僅僅和時(shí)間有關(guān)胶坠。
如果兩個(gè)聲音在時(shí)間上特別接近君账,我們?cè)诜直嫠鼈兊臅r(shí)候就會(huì)有困難。例如沈善,如果一個(gè)很響的聲音后面緊跟著一個(gè)很弱的聲音乡数,后一個(gè)聲音就很難聽到。但是如果在第一個(gè)聲音停止后過一段時(shí)間再播放第二個(gè)聲音闻牡,后一個(gè)聲音就可以聽到净赴。對(duì)純音一般來講,這個(gè)間隔時(shí)間是5毫秒罩润。當(dāng)然如果在時(shí)序上反過來玖翅,效果是一樣的。如果一個(gè)較低的聲音出現(xiàn)在一個(gè)較高的聲音之前,而且間隔很短金度,那個(gè)較低的聲音我們也聽不到应媚。
掩蔽效應(yīng)的應(yīng)用
掩蔽效應(yīng)是指人的耳朵只對(duì)最明顯的聲音反應(yīng)敏感,而對(duì)于不敏感的聲音猜极,反應(yīng)則較不為敏感中姜。例如在聲音的整個(gè)頻率譜中,如果某一個(gè)頻率段的聲音比較強(qiáng)跟伏,則人就對(duì)其它頻率段的聲音不敏感了丢胚。
應(yīng)用此原理,人們發(fā)明了mp3等壓縮的數(shù)字音樂格式酬姆,在這些格式的文件里嗜桌,只突出記錄了人耳朵較為敏感的中頻段聲音,而對(duì)于較高和較低的頻率的聲音則簡略記錄辞色,從而大大壓縮了所需的存儲(chǔ)空間骨宠。
MP3用戶可以指定每一秒的音樂是用多少個(gè)bit來存儲(chǔ)。而MP3編解碼器只關(guān)心頻率之間和音量之間的相互關(guān)系相满。
編碼過程中层亿,信號(hào)中的“無用分量”被拿來和人類心理聲學(xué)的數(shù)學(xué)模型,以及壓縮使用的比特率作比較立美,以決定要扔掉哪些數(shù)據(jù)匿又。當(dāng)前MP3壓縮使用的比特率一般是128kbps。編碼器在輸出每一幀數(shù)據(jù)的時(shí)候都會(huì)考慮到這個(gè)數(shù)字建蹄,如果比特率比較低碌更,那么“無關(guān)”和“冗余”數(shù)據(jù)的定義就會(huì)被放寬,導(dǎo)致大量的數(shù)據(jù)被認(rèn)為是無用數(shù)據(jù)洞慎,此時(shí)壓縮后的音頻會(huì)丟失大量細(xì)節(jié)痛单,導(dǎo)致音質(zhì)下降。相反劲腿,如果使用較高的比特率編碼旭绒,“無關(guān)”和“冗余”的標(biāo)準(zhǔn)就會(huì)被限定的更嚴(yán)格,細(xì)節(jié)會(huì)被保留焦人,但是文件更大挥吵。
除此之外,聽覺的掩蔽效應(yīng)在電聲領(lǐng)域也被廣泛應(yīng)用花椭。如動(dòng)態(tài)降噪忽匈,就是根據(jù)不同的節(jié)目對(duì)噪聲的掩蔽不同的原理設(shè)計(jì)的。
掩蔽效應(yīng)不僅是聽覺生理現(xiàn)象矿辽,也是心理現(xiàn)象丹允,“雞尾酒效應(yīng)”就是其中的一例歪沃。雞尾酒效應(yīng)是指當(dāng)注意力十分集中時(shí),或?qū)Ρ容^熟悉的聲音嫌松,人的聽覺可以從相當(dāng)嚴(yán)重的掩蔽噪聲下,有選擇地傾聽想要聽的聲音奕污。在許多人相聚的雞尾酒會(huì)中萎羔,可以對(duì)特定人的的講話聽的最清楚,這在實(shí)際錄音中也有很多的應(yīng)用碳默。