做實驗需要控制所有視頻的聲音的大小差不多,不然有的視頻的聲音太大有的太小,影響被試的反應;因此需要對視頻中的音頻進行標準化甩挫,這是在做音頻標準化過程中搜集到的資料,在這里匯總一下椿每,基本是從音頻標準化入門到放棄伊者。
?Audio normalization是什么?
內(nèi)容來源:
Audio normalization可以分為兩種做法:Peak (level) normalization 和 Loudness normalization间护。
Peak normalization:
將聲音最大(peak)的地方亦渗,調(diào)整到特定音量(如最大0?dBFS),然后其他音頻做相應的增/減調(diào)整汁尺。優(yōu)點是只要找出最大聲音處法精,就能決定整體的音量調(diào)整。缺點是peak對于整體音頻不一定具有代表性痴突,比如某個時刻出現(xiàn)爆炸聲搂蜓,并不一定整體都是爆炸聲,那標準化的結(jié)果會因此受到影響辽装。這個操作的一般應用在錄音階段帮碰,在錄音時提供一個聲音的范圍。用這個方法處理音頻之后拾积,可能音頻聲音最大處的聲音提高到了特定的音量收毫,其他的音段也提高了,但是有可能和最高音相比還是差很多殷勘。
Loudness normalization:
先計算出整體聲音的平均音量,再根據(jù)平均音量到期望音量的差值昔搂,做為調(diào)整的依據(jù)玲销,最后使的平均音量達到期望音量的大小。優(yōu)點是平均音量比較有代表性摘符,缺點是計算比較復雜贤斜,大音量在調(diào)整時策吠,由于音量爆表被切掉了,各個音量之間的對比也變的不一樣瘩绒。應用場景:當音樂表單中有很多歌曲時猴抹,這些歌曲的聲音大小都不同,有的歌曲的聲音很大锁荔,有的很小蟀给,這樣會迫使使用者不斷調(diào)整音量的大小,所以需要一個標準來解決這樣的問題阳堕。比如YouTube跋理,他的音量的大小是?14LUFS,如果上傳者的視頻的聲音大小為?10?LUFS,恬总,那么他就會把上傳的音頻再降低4 dB前普,使其達到平臺的標準的聲音。
?Audio normalization 怎么做壹堰?
How can I normalize audio using ffmpeg?
其實有很多軟件可以用的拭卿,比如MP3Gain,Audition...之類的贱纠,但是本著自己動手豐衣足食的想法搔确,還是去谷歌了一下,連接上介紹用ffmpeg和 ffmpeg-normalize 的python庫的方法讽坏,這兩種方法本質(zhì)上是一樣的溃列,最后都是用ffmpeg來實現(xiàn)的。
Audio normalization 的標準是什么懊渡?
這里介紹了音頻處理的常識和一些名詞
名詞解釋
增益刽射,英文是gain,其定義是:對元器件剃执、電路誓禁、設備或系統(tǒng),其電流肾档、電壓或功率增加的程度摹恰。通過這個定義可知,在對音頻設置增益時怒见,音量提升了俗慈,音頻輸出的電流、功率也隨之提升遣耍,假如音頻具有很大的噪音闺阱,噪音也會隨著增益的升高而變大,尤其是有交流聲噪音的音頻舵变,因此音頻增益不只是簡單的放大音量酣溃。增益的單位是分貝dB瘦穆。