降噪是聲音錄制和后期制作中經(jīng)常會用到的程序固以。降噪的原理是利用噪聲和信號之間的模式差別識別出噪聲岭参。信噪比越高,聲音之間的差別越大昌渤,就越容易分離。現(xiàn)在常用的差別包括響度和頻率之間的差異憔四。一些常見的噪聲已經(jīng)被總結(jié)出了很多特征膀息,有很多專門的工具來去除。
用頻率差異去除電流聲
電流聲是指交流電頻率進入了聲音了赵。如果錄音設(shè)備用的是直流電潜支,通常情況下都不太會出現(xiàn)。但是柿汛,如果用的是交流電供電冗酿,或者電磁屏蔽沒有做好,聲音信號里面就有可能混入交流電頻率。
用頻譜圖可以比較容易的看出是否有電流聲裁替。比較極端的電流聲
用頻譜圖有時還可以順便看出其他類型的噪聲项玛,比如下面圖中的高頻噪聲:
在 Audacity 里面,可以用 Notch Filter 來去除特定頻率的噪聲弱判。
用響度差異去除白噪聲
白噪聲的音量通常不大襟沮,但是頻率分布廣,可以采用 Noise Gate 的方式來去除昌腰。Noise Gate 是設(shè)定一個音量門檻开伏,所有低于這個門檻的都定義為噪聲。因為一旦音量超過這個門檻遭商,聲音就不會有任何變動固灵,所以 Noise Gate 一般來說都不會破壞音樂或者談話質(zhì)量。
如果噪音太高株婴,與語音的響度差別不明顯怎虫,用 Noise Gate 的方式就不容易去除。
Audacity 里面的 Noise Gate 是一個第三方插件困介,Level Reduction 和 Attack/Decay 參數(shù)都是為了避免降噪過后缺乏過渡大审,出現(xiàn)失真。Level Reduction 的默認值是 -12 dB座哩,最大可以到 -100 dB徒扶,但是太大之后,降噪部分容易與語音片段分隔太明顯根穷。Attack/Decay 也是在降噪和未降噪片段之間留一些緩沖期姜骡。Gate threshold 就是重要的分隔線。設(shè)定這個值之前可以用 Noise Gate 提供的 Analyse Noise Level 選定一部分噪音片段測量一下噪音的響度屿良。
綜合頻率和響度差異的降噪方式
Audacity 自帶的 Noise Reduction 功能綜合了頻率和響度差異來區(qū)分信號和噪聲圈澈。它會根據(jù)你指定的噪聲片段,將其不同頻率帶的響度歸納出來尘惧。如果一個聲音片段的某個頻率帶響度低于這個參考值康栈,就把這個頻率帶響度降低。因為用了頻率特征喷橙,如果參數(shù)設(shè)定不合適啥么,會損害信號質(zhì)量。
- Noise reduction (dB):這個應(yīng)該是指把噪聲降低多少分貝贰逾。取值范圍為0-48悬荣,默認值為12,應(yīng)該是指把音量降低到1/4疙剑。
- Sensitivity:取值范圍0-24氯迂,默認6践叠。
- Frequency smoothing (bands):取值0-12,默認3囚戚。這個值越大酵熙,頻率帶越多,也越容易降低信號質(zhì)量驰坊。3個 bands 應(yīng)該差不多代表著高中低頻匾二。
廣義的降噪
降噪可以看成是特殊的信號分離。廣義上說拳芙,所有想要從單個音軌上分離去除的聲音都是噪聲察藐。不同聲音之間的模式差別識別越好,聲音就分離得越好≈墼現(xiàn)在的聲音分離方案還處在比較初步的階段分飞,適用場景和分離效果都比較有限,這個領(lǐng)域應(yīng)該是機器學(xué)習(xí)可以大展拳腳的領(lǐng)域睹限。
ICS-FORTH Audio Group 做出的聲源分離就是這種廣義降噪的體現(xiàn)譬猫。但是這個視頻里面的聲源分離用到了8個麥克風(fēng)組成的陣列,對一般的聲音后期處理沒有多大幫助羡疗。
Stanford 的博士 Nicholas J. Bryan 在他的博士論文里開發(fā)了一個互動式的音頻分離軟件 Interactive Source Separation Editor ISSE染服,可以把不同的聲音分離開來。他的 Demo 里面展示了電話鈴聲與語音的分離叨恨,不同樂器的分離柳刮,以及人聲與背景音樂的分離。(Nick 畢業(yè)之后去了蘋果痒钝。)
如果想做其它的聲音分離秉颗,例如從音樂中分離伴奏和人聲,有專門的工具可以處理送矩。Audacity 里面帶有 Vocal Remover 和 Vocal Reduction and Isolation蚕甥,還列舉出了一系列可以用的第三方插件。這些工具的主要原理是雙聲道音樂中的人聲通常都在正中間栋荸,而樂器錄制的時候則有可能有左右區(qū)別梢灭。根據(jù)這種左右區(qū)別,把其中一個聲道 invert蒸其,然后疊加到另一個聲道上,就可以消除很大一部分中置人聲库快。