采樣頻率
采樣頻率是指單位時(shí)間內(nèi)對(duì)聲音模擬信號(hào)的采樣次數(shù),采樣率類似于視頻的幀數(shù)暖庄,比如電影的采樣率是24Hz馁痴,當(dāng)我們把采樣到的一個(gè)個(gè)靜止的畫面再以采樣率同樣的速度回放時(shí),看到的就是連續(xù)的畫面检访,同樣的道理,把以44.1kHz采樣率紀(jì)錄的cd以同樣的速率播放時(shí)仔掸,就能聽到連續(xù)的聲音脆贵,顯然,這個(gè)采樣率越高起暮,聽到的聲音和看到的畫面就越連貫卖氨,當(dāng)然,人的聽覺和視覺器官能分辨的采樣率是有限的负懦,對(duì)同一段聲音筒捺,用20kHz和44.1kHz來采樣,重放時(shí)纸厉,可能可以聽出其中的差別系吭,而基本上高于44.1kHZ采樣的聲音,比如說96kHz采樣残腌,絕大部分人已經(jīng)覺察不到兩種采樣出來的聲音的分別了村斟。之所以使用44.1kHZ這個(gè)數(shù)值是因?yàn)榻?jīng)過了反復(fù)實(shí)驗(yàn),人們發(fā)現(xiàn)這個(gè)采樣精度最合適抛猫,低于這個(gè)值就會(huì)有較明顯的損失蟆盹,而高于這個(gè)值人的耳朵已經(jīng)很難分辨,而且增大了數(shù)字音頻所占用的空間闺金。我們所使用的CD的采樣標(biāo)準(zhǔn)就是44.1k
采樣位數(shù)
采樣位數(shù)可以理解為采集卡處理聲音的解析度逾滥。這個(gè)數(shù)值越大,解析度就越高败匹,錄制和回放的聲音就越真實(shí)寨昙。我們首先要知道:電腦中的聲音文件是用數(shù)字0和1來表示的。連續(xù)的模擬信號(hào)按一定的采樣頻率經(jīng)數(shù)碼脈沖取樣后掀亩,每一個(gè)離散的脈沖信號(hào)被以一定的量化精度量化成一串二進(jìn)制編碼流舔哪,這串編碼流的位數(shù)即為采樣位數(shù),也稱為量化精度
在電腦上錄音的本質(zhì)就是把模擬聲音信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)槽棍。反之捉蚤,在播放時(shí)則是把數(shù)字信號(hào)還原成模擬聲音信號(hào)輸出。采集卡的位是指采集卡在采集和播放聲音文件時(shí)所使用數(shù)字聲音信號(hào)的二進(jìn)制位數(shù)炼七。采集卡的位客觀地反映了數(shù)字聲音信號(hào)對(duì)輸入聲音信號(hào)描述的準(zhǔn)確程度缆巧。例如,同一段音頻信息豌拙,使用8bit描述單個(gè)采樣信息陕悬,那么采樣量化的范圍就是0255,如果使用16bit表示單個(gè)采樣值,那么相應(yīng)的采樣量化的范圍為064k。與8位采樣位數(shù)相比按傅,動(dòng)態(tài)范圍更寬廣捉超,聲音的被記錄的更加精細(xì)胧卤。一般CD使用的采樣位數(shù)為16位
16位二進(jìn)制數(shù)的最小值是0000000000000000,最大值是1111111111111111拼岳,對(duì)應(yīng)的十進(jìn)制數(shù)就是0和65535灌侣,也就是最大和最小值之間的差值是65535,也就是說裂问,它量化的模擬量的動(dòng)態(tài)范圍可以差65535侧啼,也就是96.32分貝(20 * lg65535)),所以堪簿,量化精度只和動(dòng)態(tài)范圍有關(guān)痊乾,和頻率響應(yīng)沒關(guān)系。動(dòng)態(tài)范圍定在96分貝也是有道理的椭更,人耳的無痛苦極限聲壓是90分貝哪审,96分貝的動(dòng)態(tài)范圍在普通應(yīng)用中足夠使用,所以96分貝動(dòng)態(tài)范圍內(nèi)的模擬波虑瀑,經(jīng)量化后湿滓,不會(huì)產(chǎn)生削波失真的
位速/比特率/碼率
位速/比特率/碼率描述的都是一個(gè)東西,是指在一個(gè)數(shù)據(jù)流中每秒鐘能通過的信息量舌狗。我們可能看到過音頻文件用 “128–Kbps MP3” 或 “64–Kbps WMA” 進(jìn)行描述的情形叽奥。Kbps 表示 “每秒千位數(shù)”,因此數(shù)值越大表示數(shù)據(jù)越多:128–Kbps MP3 音頻文件包含的數(shù)據(jù)量是 64–Kbps WMA 文件的兩倍痛侍,并占用兩倍的空間朝氓。(不過在這種情況下,這兩種文件聽起來沒什么兩樣主届。原因是什么呢赵哲?有些文件格式比其他文件能夠更有效地利用數(shù)據(jù), 64–Kbps WMA 文件的音質(zhì)與 128–Kbps MP3 的音質(zhì)相同君丁。)需要了解的重要一點(diǎn)是枫夺,位速越高,信息量越大绘闷,對(duì)這些信息進(jìn)行解碼的處理量就越大橡庞,文件需要占用的空間也就越多
碼率=取樣頻率×量化精度×聲道數(shù)
一張CD,雙聲道,采樣率44.1kHz,每個(gè)采樣位數(shù)13bit簸喂,時(shí)長(zhǎng)74分鐘(4440秒)毙死,則CD的容量為13244100*4440約等于640MB燎潮。
VBR喻鳄、ABR、CBR
VBR(Variable Bitrate)動(dòng)態(tài)比特率确封。也就是沒有固定的比特率除呵,壓縮軟件在壓縮時(shí)根據(jù)音頻數(shù)據(jù)即時(shí)確定使用什么比特率再菊。這是新發(fā)展的算法,他們將一首歌的復(fù)雜部分用高Bitrate編碼颜曾,簡(jiǎn)單部分用低Bitrate編碼纠拔。主意雖然不錯(cuò),可惜新編碼器的VBR算法很差泛豪,音質(zhì)與CBR相去甚遠(yuǎn)稠诲。幸運(yùn)的是, Lame完美地優(yōu)化了VBR算法诡曙,使之成為MP3的最佳編碼模式臀叙。這是以質(zhì)量為前提兼顧文件大小的方式,推薦編碼模式价卤。
ABR(Average Bitrate)平均比特率劝萤,是VBR的一種插值參數(shù)。Lame針對(duì)CBR不佳的文件體積比和VBR生成文件大小不定的特點(diǎn)獨(dú)創(chuàng)了這種編碼模式慎璧。ABR也被稱為“Safe VBR”床嫌,它是在指定的平均Bitrate內(nèi),以每50幀(30幀約1秒)為一段胸私,低頻和不敏感頻率使用相對(duì)低的流量厌处,高頻和大動(dòng)態(tài)表現(xiàn)時(shí)使用高流量。舉例來說岁疼,當(dāng)指定用192kbps ABR對(duì)一段wav文件進(jìn)行編碼時(shí)嘱蛋,Lame會(huì)將該文件的85%用192kbps固定編碼,然后對(duì)剩余15%進(jìn)行動(dòng)態(tài)優(yōu)化:復(fù)雜部分用高于192kbps 來編碼五续、簡(jiǎn)單部分用低于192kbps來編碼洒敏。與192kbps CBR相比,192kbps ABR在文件大小上相差不多疙驾,音質(zhì)卻提高不少凶伙。ABR編碼在速度上是VBR編碼的2到3倍,在128-256kbps范圍內(nèi)質(zhì)量要好于CBR它碎『伲可以做為 VBR和CBR的一種折衷選擇。
CBR(Constant Bitrate)扳肛,常數(shù)比特率傻挂,指文件從頭到尾都是一種位速率。相對(duì)于VBR和ABR來講挖息,它壓縮出來的文件體積很大金拒,但音質(zhì)卻不會(huì)有明顯的提高
PCM格式與LPCM格式
PCM(脈沖編碼調(diào)制)是一種將模擬語音信號(hào)變換為數(shù)字信號(hào)的編碼方式。主要經(jīng)過3個(gè)過程:抽樣、量化和編碼绪抛。抽樣過程將連續(xù)時(shí)間模擬信號(hào)變?yōu)殡x散時(shí)間资铡、連續(xù)幅度的抽樣信號(hào),量化過程將抽樣信號(hào)變?yōu)殡x散時(shí)間幢码、離散幅度的數(shù)字信號(hào)笤休,編碼過程將量化后的信號(hào)編碼成為一個(gè)二進(jìn)制碼組輸出。
量化分為線性量化和非線性量化症副。線性量化在整個(gè)量化范圍內(nèi)店雅,量化間隔均相等,稱為L(zhǎng)PCM贞铣。非線性量化采用不等的量化間隔底洗。量化間隔數(shù)由編碼的二進(jìn)制位數(shù)決定。例如咕娄,CD采用16bit線性量化亥揖,則量化間隔數(shù)L=65536。位數(shù)(n)越多圣勒,精度越高费变,信噪比SNR=6.02n+1.76(dB)也越高。但編碼的二進(jìn)制位數(shù)不是無限制的圣贸,需要根據(jù)所需的數(shù)據(jù)率確定挚歧。比如:CD可以達(dá)到的數(shù)據(jù)率為2×44.1×16=1411.2Kbit/s。
總而言之吁峻,LPCM格式中的音頻數(shù)據(jù)是未壓縮的線性量化后的音頻數(shù)據(jù)滑负。
壓縮過的音頻格式
在常見的音頻格式對(duì)PCM原始幀進(jìn)行封裝時(shí)也是以frame幀為單位的,我們一般將壓縮后的音頻數(shù)據(jù)幀稱為媒體幀用含,對(duì)應(yīng)原始的PCM數(shù)據(jù)稱為原始幀矮慕。每個(gè)媒體幀又分成head頭,body數(shù)據(jù)體啄骇。在幀頭中痴鳄,會(huì)存儲(chǔ)這個(gè)媒體幀中body部分的碼率,采樣率等解碼必須的信息缸夹,因此每一個(gè)媒體幀都可以獨(dú)立于文件存在和播放痪寻。在body中存儲(chǔ)著一個(gè)或者多個(gè)媒體幀,這些媒體真是若干個(gè)PCM原始幀經(jīng)過特定的壓縮算法壓縮得到的虽惭。通常情況下橡类,我們將單位時(shí)間的媒體幀的個(gè)數(shù)稱為幀率。
上文的采樣率和幀率這兩個(gè)概念都描述了音頻媒體的“連續(xù)”性芽唇,二者的區(qū)別在于每個(gè)音頻的媒體幀中會(huì)包含多個(gè)音頻采樣(多個(gè)PCM data)顾画,如1個(gè)AAC幀中包含1024個(gè)采樣。
let
聲明常量,var
聲明變量