音頻的量化過程
音頻的量化就是將模擬信號(hào)采樣后轉(zhuǎn)換成一種數(shù)字信號(hào)的過程
模擬信號(hào)轉(zhuǎn)換數(shù)字信號(hào)的基本流程圖
量化過程有如下概念:
- 采樣大邢铡:就是我們采樣模擬型號(hào)值表達(dá)的Y軸的高度(幅值),也就是一個(gè)采樣需要多少個(gè)bit位來存儲(chǔ)徽诲,常用的是8bit索抓、16bit
- 采樣率:采樣模擬型號(hào)的頻率(每秒采集N次模擬信號(hào)樣本),是單位Hz赁温,也就是我們常熟的采樣頻率孝治,通常采樣頻率越高,精度也越高,常用的采樣頻率有8K肖油、16K、32K臂港、44.1K森枪、48K,對(duì)于AAC來說一般來說采用44.1K
- 聲道數(shù):有單聲道审孽、雙聲道县袱、多聲道
- 比特率:比特率是指每秒傳送的比特(bit)數(shù)。單位為 bps(Bit Per Second)佑力,比特率越高式散,每秒傳送數(shù)據(jù)就越多,畫質(zhì)就越清晰打颤。聲音中的比特率(碼率)是指將模擬聲音信號(hào)轉(zhuǎn)換成數(shù)字聲音信號(hào)后暴拄,單位時(shí)間內(nèi)的二進(jìn)制數(shù)據(jù)量,是間接衡量音頻質(zhì)量的一個(gè)指標(biāo)编饺。 計(jì)算一個(gè)PCM(脈沖編碼調(diào)制)音頻流的碼率公式如下:
采樣率 * 采樣大小 * 聲道數(shù):例如一個(gè)PCM編碼的音頻文件乖篷,它的采樣率為44.1KHz,采樣大小為16bit,雙聲道反肋,那么碼率為44.1KHz * 16 * 2 = 1411.2Kb/s
常見音頻壓縮方法:
主要兩種方法:
- 消除冗余數(shù)據(jù):我們成為有損壓縮技術(shù)那伐,我們?cè)谝纛l的采集過程中,但是其中只有一部分是人能夠識(shí)別出來的石蔗,我們對(duì)人能夠識(shí)別出來的數(shù)據(jù)進(jìn)行篩選罕邀,這樣叫減少了數(shù)據(jù)的存儲(chǔ)
- 哈夫曼無損壓縮
常見音頻編碼器:
OPUS、AAC养距、Vorbis诉探、Speex、iLBC棍厌、AMR肾胯、G.711等
應(yīng)用領(lǐng)域和優(yōu)缺點(diǎn):
- OPUS編碼器是一個(gè)有損聲音編碼的格式,格式是一個(gè)開放格式耘纱,沒有任何專利或限制敬肚,低碼率下Opus完勝曾經(jīng)優(yōu)勢明顯的HE AAC,中碼率就已經(jīng)可以媲敵碼率高出30%左右的AAC格式束析,而高碼率下更接近原始音頻艳馒。
- AAC用在泛娛樂化直播系統(tǒng)里用的比較多,RTMP支撐AAC,SPEEX员寇,但是不支持OPUS
- Speex早于OPUS和AAC弄慰,最大的特點(diǎn)是包括外圍的模塊,降噪蝶锋,回音消除
- G.711多用于電話系統(tǒng)
性能評(píng)測對(duì)比圖:
AAC (Advanced Audio Coding) 高級(jí)音頻編碼:
出現(xiàn)于1997年陆爽,基于MPEG-2的音頻編碼技術(shù)。由Fraunhofer IIS扳缕、杜比實(shí)驗(yàn)室慌闭、AT&T、Sony等公司共同開發(fā)躯舔,目的是取代MP3格式贡必。2000年,MPEG-4標(biāo)準(zhǔn)出現(xiàn)后庸毫,AAC重新集成了其特性仔拟,加入了SBR技術(shù)和PS技術(shù),為了區(qū)別于傳統(tǒng)的MPEG-2 AAC又稱為MPEG-4 AAC
AAC優(yōu)缺點(diǎn)
優(yōu)點(diǎn):相對(duì)于mp3飒赃,AAC格式的音質(zhì)更佳利花,文件更小
不足:AAC屬于有損壓縮的格式,與時(shí)下流行的APE载佳、FLAC等無損格式相比音質(zhì)存在“本質(zhì)上”的差距AAC 常用規(guī)格:
AAC LC炒事、AAC HE V1、AAC HE V2
AAC LC
:(Low Complexity)低復(fù)雜度蔫慧,碼流128K
AAC HE V1
:AAC LC + SBR (Spectral Band Replication)采用分頻復(fù)用挠乳,將一個(gè)音頻的頻帶分成低頻和高頻兩部分分別進(jìn)行編碼,對(duì)于低頻信號(hào)采樣記錄主體信號(hào),從而減少采樣數(shù)據(jù)睡扬。對(duì)于高頻數(shù)據(jù)盟蚣,同樣采樣率下高頻采樣的樣本會(huì)相對(duì)于低頻少很多,使用SBR技術(shù)則增加高頻信號(hào)的采樣數(shù)目卖怜,從而保證高頻的音質(zhì)屎开,這樣就實(shí)現(xiàn)了采樣的碼率的同時(shí)又提高了高頻數(shù)據(jù)的音質(zhì)
AAC HE V2
:AAC LC + SBR + PS (Parametric Stereo) 雙聲道分別保存,一個(gè)聲道完整保存马靠,另一個(gè)聲道存儲(chǔ)差異信息和相關(guān)參數(shù)信息AAC常用格式:
ADIF
(Audio Data Interchange Format) 音頻數(shù)據(jù)交換格式:這種格式的特征是可以確定的找到這個(gè)音頻數(shù)據(jù)的開始奄抽,不需進(jìn)行在音頻數(shù)據(jù)流中間開始的解碼,即它的解碼必須在明確定義的開始處進(jìn)行,故這種格式常用在磁盤文件中
ADTS
(Audio Data Transport Stream) 音頻數(shù)據(jù)傳輸流:每一幀都有一個(gè)同步字甩鳄,可以在音頻的任何位置開始解碼AAC常用編碼庫
libfdk_aac逞度、ffmpeg aac、libfaac妙啃、libvo_aacenc性能也是由左向右遞減