自然界中的聲音非常復雜忱叭,波形極其復雜隔崎,通常我們采用的是脈沖代碼調制編碼,即PCM編碼韵丑。PCM通過抽樣爵卒、量化、編碼三個步驟將連續(xù)變化的模擬信號轉換為數(shù)字編碼撵彻。
1钓株、什么是采樣率和采樣大小(位/bit)陌僵?
聲音其實是一種能量波轴合,因此也有頻率和振幅的特征,頻率對應于時間軸線碗短,振幅對應于電平軸線受葛。波是無限光滑的,弦線可以看成由無數(shù)點組成偎谁,由于存儲空間是相對有限的总滩,數(shù)字編碼過程中,必須對弦線的點進行采樣巡雨。采樣的過程就是抽取某點的頻率值闰渔,很顯然,在一秒中內抽取的點越多鸯隅,獲取得頻率信息更豐富澜建,為了復原波形,一次振動中蝌以,必須有2個點的采樣炕舵,人耳能夠感覺到的最高頻率為20kHz,因此要滿足人耳的聽覺要求跟畅,則需要至少每秒進行40k次采樣咽筋,用40kHz表達,這個40kHz就是采樣率徊件。我們常見的CD奸攻,采樣率為44.1kHz。光有頻率信息是不夠的虱痕,我們還必須獲得該頻率的能量值并量化睹耐,用于表示信號強度。量化電平數(shù)為2的整數(shù)次冪部翘,我們常見的CD位16bit的采樣大小硝训,即2的16次方。采樣大小相對采樣率更難理解,因為要顯得抽象點窖梁,舉個簡單例子:假設對一個波進行8次采樣赘风,采樣點分別對應的能量值分別為A1-A8,但我們只使用2bit的采樣大小纵刘,結果我們只能保留A1-A8中4個點的值而舍棄另外4個邀窃。如果我們進行3bit的采樣大小,則剛好記錄下8個點的所有信息假哎。采樣率和采樣大小的值越大瞬捕,記錄的波形更接近原始信號。
2位谋、有損和無損
根據(jù)采樣率和采樣大小可以得知山析,相對自然界的信號,音頻編碼最多只能做到無限接近掏父,至少目前的技術只能這樣了笋轨,相對自然界的信號,任何數(shù)字音頻編碼方案都是有損的赊淑,因為無法完全還原爵政。在計算機應用中,能夠達到最高保真水平的就是PCM編碼陶缺,被廣泛用于素材保存及音樂欣賞钾挟,CD、DVD以及我們常見的WAV文件中均有應用饱岸。因此掺出,PCM就被約定俗成的認為是無損編碼,因為PCM代表了數(shù)字音頻中最佳的保真水準苫费,并不意味著PCM就能夠確保信號絕對保真汤锨,PCM也只能做到最大程度的無限接近。我們而習慣性的把MP3列入有損音頻編碼范疇百框,是相對PCM編碼的闲礼。強調編碼的相對性的有損和無損,是為了告訴大家铐维,要做到真正的無損是困難的柬泽,就像用數(shù)字去表達圓周率,不管精度多高嫁蛇,也只是無限接近锨并,而不是真正等于圓周率的值。
3睬棚、為什么要使用音頻壓縮技術
要算一個PCM音頻流的碼率是一件很輕松的事情琳疏,采樣率值×采樣大小值×聲道數(shù) bps有决。一個采樣率為44.1KHz,采樣大小為16bit空盼,雙聲道的PCM編碼的WAV文件,它的數(shù)據(jù)速率則為 44.1K×16×2 =1411.2 Kbps新荤。我們常說128K的MP3揽趾,對應的WAV的參數(shù),就是這個1411.2 Kbps苛骨,這個參數(shù)也被稱為數(shù)據(jù)帶寬篱瞎,它和ADSL中的帶寬是一個概念。將碼率除以8,就可以得到這個WAV的數(shù)據(jù)速率痒芝,即176.4KB/s俐筋。這表示存儲一秒鐘采樣率為44.1KHz,采樣大小為16bit严衬,雙聲道的PCM編碼的音頻信號澄者,需要176.4KB的空間,1分鐘則約為10.34M请琳,這對大部分用戶是不可接受的粱挡,尤其是喜歡在電腦上聽音樂的朋友,要降低磁盤占用俄精,只有2種方法询筏,降低采樣指標或者壓縮。降低指標是不可取的竖慧,因此專家們研發(fā)了各種壓縮方案嫌套。由于用途和針對的目標市場不一樣,各種音頻壓縮編碼所達到的音質和壓縮比都不一樣圾旨,在后面的文章中我們都會一一提到踱讨。有一點是可以肯定的,他們都壓縮過碳胳。
4勇蝙、頻率與采樣率的關系
采樣率表示了每秒對原始信號采樣的次數(shù),我們常見到的音頻文件采樣率多為44.1KHz挨约,這意味著什么呢味混?假設我們有2段正弦波信號,分別為20Hz和20KHz诫惭,長度均為一秒鐘翁锡,以對應我們能聽到的最低頻和最高頻,分別對這兩段信號進行40KHz的采樣夕土,我們可以得到一個什么樣的結果呢馆衔?結果是:20Hz的信號每次振動被采樣了40K/20=2000次瘟判,而20K的信號每次振動只有2次采樣。顯然角溃,在相同的采樣率下拷获,記錄低頻的信息遠比高頻的詳細。這也是為什么有些音響發(fā)燒友指責CD有數(shù)碼聲不夠真實的原因减细,CD的44.1KHz采樣也無法保證高頻信號被較好記錄匆瓜。要較好的記錄高頻信號,看來需要更高的采樣率未蝌,于是有些朋友在捕捉CD音軌的時候使用48KHz的采樣率驮吱,這是不可取的!這其實對音質沒有任何好處萧吠,對抓軌軟件來說左冬,保持和CD提供的44.1KHz一樣的采樣率才是最佳音質的保證之一,而不是去提高它纸型。較高的采樣率只有相對模擬信號的時候才有用拇砰,如果被采樣的信號是數(shù)字的,請不要去嘗試提高采樣率绊袋。
5毕匀、流特征
隨著網絡的發(fā)展,人們對在線收聽音樂提出了要求癌别,因此也要求音頻文件能夠一邊讀一邊播放皂岔,而不需要把這個文件全部讀出后然后回放,這樣就可以做到不用下載就可以實現(xiàn)收聽了展姐。也可以做到一邊編碼一邊播放躁垛,正是這種特征,可以實現(xiàn)在線的直播圾笨,架設自己的數(shù)字廣播電臺成為了現(xiàn)實教馆。