前言:
記載資料多為網(wǎng)絡(luò)搜集波势,侵刪。
根據(jù)最近接觸的整機(jī)項(xiàng)目做了一些整機(jī)音頻相關(guān)基礎(chǔ)知識的總結(jié)瘾英,如有不足或表述問題請指正。
第一部分 模擬聲音-數(shù)字聲音原理
一颂暇、模擬聲音數(shù)字化原理
聲音是通過空氣傳播的一種連續(xù)的波缺谴,叫聲波。聲音的強(qiáng)弱體現(xiàn)在聲波壓力的大小上耳鸯,音調(diào)的高低體現(xiàn)在聲音的頻率上湿蛔。聲音用電表示時(shí),聲音信號在時(shí)間和幅度上都是連續(xù)的模擬信號县爬。
聲音進(jìn)入計(jì)算機(jī)的第一步就是數(shù)字化阳啥,數(shù)字化實(shí)際上就是采樣和量化。連續(xù)時(shí)間的離散化通過采樣來實(shí)現(xiàn)财喳。聲音數(shù)字化需要回答兩個(gè)問題:
①每秒鐘需要采集多少個(gè)聲音樣本苫纤,也就是采樣頻率(fs)是多少
②每個(gè)聲音樣本的位數(shù)(bit per sample,bps)應(yīng)該是多少纲缓,也就是量化精度卷拘。
采樣頻率
采樣頻率的高低是根據(jù)奈奎斯特理論(Nyquist theory)和聲音信號本身的最高頻率決定的。奈奎斯特理論指出祝高,采樣頻率不應(yīng)低于聲音信號最高頻率的兩倍栗弟,這樣才能把以數(shù)字表達(dá)的聲音還原成原來的聲音。采樣的過程就是抽取某點(diǎn)的頻率值工闺,很顯然乍赫,在一秒中內(nèi)抽取的點(diǎn)越多,獲取得頻率信息更豐富陆蟆,為了復(fù)原波形雷厂,一次振動中,必須有2個(gè)點(diǎn)的采樣叠殷,人耳能夠感覺到的最高頻率為20kHz改鲫,因此要滿足人耳的聽覺要求,則需要至少每秒進(jìn)行40k次采樣,用40kHz表達(dá)像棘,這個(gè)40kHz就是采樣率稽亏。我們常見的CD,采樣率為44.1kHz缕题。電話話音的信號頻率約為3.4kHz截歉,采樣頻率就選為8 kHz。
量化精度
光有頻率信息是不夠的烟零,我們還必須紀(jì)錄聲音的幅度瘪松。量化位數(shù)越高,能表示的幅度的等級數(shù)越多锨阿。例如宵睦,每個(gè)聲音樣本用3bit表示,測得的聲音樣本值是在0~8的范圍里群井。我們常見的CD位16bit的采樣精度状飞,即音量等級有2的16次方個(gè)。樣本位數(shù)的大小影響到聲音的質(zhì)量书斜,位數(shù)越多诬辈,聲音的質(zhì)量越高,而需要的存儲空間也越多荐吉。
壓縮編碼
經(jīng)過采樣焙糟、量化得到的PCM數(shù)據(jù)就是數(shù)字音頻信號了,可直接在計(jì)算機(jī)中傳輸和存儲样屠。但是這些數(shù)據(jù)的體積太龐大了穿撮!為了便于存儲和傳輸,就需要進(jìn)一步壓縮痪欲,就出現(xiàn)了各種壓縮算法悦穿,將PCM轉(zhuǎn)換為MP3,AAC,WMA等格式。
常見的用于語音(Voice)的編碼有:EVRC (Enhanced Variable Rate Coder) 增強(qiáng)型可變速率編碼业踢,AMR栗柒、ADPCM、G.723.1知举、G.729等瞬沦。常見的用于音頻(Audio)的編碼有:MP3、AAC雇锡、AAC+逛钻、WMA等。
二锰提、問題
1曙痘、為什么要使用音頻壓縮技術(shù)芳悲?
我們可以拿一個(gè)未壓縮的CD文件(PCM音頻流)和一個(gè)MP3文件作一下對比:
PCM音頻:一個(gè)采樣率為44.1KHz,采樣大小為16bit屡江,雙聲道的PCM編碼CD文件芭概,它的數(shù)據(jù)速率則為44.1K×16×2 =1411.2 Kbps赛不,這個(gè)參數(shù)也被稱為數(shù)據(jù)帶寬惩嘉。將碼率除以8bit,就可以得到這個(gè)CD的數(shù)據(jù)速率,即176.4KB/s踢故。這表示存儲一秒鐘PCM編碼的音頻信號文黎,需要176.4KB的空間。
MP3音頻:將這個(gè)WAV文件壓縮成普通的MP3殿较,44.1KHz耸峭,128Kbps的碼率,它的數(shù)據(jù)速率為128Kbps/8=16KB/s淋纲。
2劳闹、頻率與采樣率的關(guān)系
采樣率表示了每秒對原始信號采樣的次數(shù),我們常見到的音頻文件采樣率多為44.1KHz洽瞬,這意味著什么呢本涕?假設(shè)我們有2段正弦波信號,分別為20Hz和20KHz伙窃,長度均為一秒鐘菩颖,以對應(yīng)我們能聽到的最低頻和最高頻,分別對這兩段信號進(jìn)行40KHz的采樣为障,我們可以得到一個(gè)什么樣的結(jié)果呢晦闰?結(jié)果是:20Hz的信號每次振動被采樣了40K/20=2000次,而20K的信號每次振動只有2次采樣鳍怨。顯然呻右,在相同的采樣率下,記錄低頻的信息遠(yuǎn)比高頻的詳細(xì)鞋喇。這也是為什么有些音響發(fā)燒友指責(zé)CD有數(shù)碼聲不夠真實(shí)的原因声滥,CD的44.1KHz采樣也無法保證高頻信號被較好記錄。要較好的記錄高頻信號确徙,看來需要更高的采樣率醒串,于是有些朋友在捕捉CD音軌的時(shí)候使用48KHz的采樣率,這是不可取的鄙皇!這其實(shí)對音質(zhì)沒有任何好處芜赌,對抓軌軟件來說,保持和CD提供的44.1KHz一樣的采樣率才是最佳音質(zhì)的保證之一伴逸,而不是去提高它缠沈。較高的采樣率只有相對模擬信號的時(shí)候才有用,如果被采樣的信號是數(shù)字的,請不要去嘗試提高采樣率洲愤。
3颓芭、流特征
隨著網(wǎng)絡(luò)的發(fā)展,人們對在線收聽音樂提出了要求柬赐,因此也要求音頻文件能夠一邊讀一邊播放亡问,而不需要把這個(gè)文件全部讀出后然后回放,這樣就可以做到不用下載就可以實(shí)現(xiàn)收聽了肛宋。也可以做到一邊編碼一邊播放州藕,正是這種特征,可以實(shí)現(xiàn)在線的直播酝陈,架設(shè)自己的數(shù)字廣播電臺成為了現(xiàn)實(shí)床玻。
第二部分? ?音頻壓縮編碼
一.有損(lossy)/無損(lossless)/未壓縮(uncompressed)音頻格式
未壓縮音頻是一種沒經(jīng)過任何壓縮的簡單音頻。未壓縮音頻通常用于影音文件的的PCM或WAV音軌沉帮。
無損壓縮音頻是對未壓縮音頻進(jìn)行沒有任何信息/質(zhì)量損失的壓縮機(jī)制锈死。無損壓縮音頻一般不使用于影音世界,但是存在的格式有無損WMA或Matroska里的FLAC穆壕。
有損壓縮音頻嘗試盡可能多得從原文件刪除沒有多大影響的數(shù)據(jù)待牵,有目的地制成比原文件小多的但音質(zhì)卻基本一樣。有損壓縮音頻普遍流行于影音文件粱檀,包括AC3, DTS, AAC, MPEG-1/2/3, Vorbis, 和Real Audio.
我們也來討論下無損/有損壓縮過程洲敢。只要你轉(zhuǎn)換成一種有損壓縮音頻格式(例如wav轉(zhuǎn)MP3),質(zhì)量上有損失茄蚯,那么它就是有損壓縮压彭。從有損壓縮音頻格式轉(zhuǎn)換成另一有損壓縮音頻格式(例如Mp3轉(zhuǎn)AAC)更槽糕,因?yàn)樗粌H會引入原文件存在的損失渗常,而且第2次編碼也會有損失壮不。
二、語音(Voice)編碼和音頻(Audio)編碼
語音編碼主要是針對語音通信系統(tǒng)中的編碼方案皱碘,應(yīng)用在有線或無線通信中询一;音頻編碼是針對音樂的編碼方案,主要用來更方便地實(shí)現(xiàn)對音樂文件進(jìn)行網(wǎng)絡(luò)傳輸和存儲癌椿。兩者的差別一方面是頻帶不同健蕊,另一方面是壓縮要求不一樣,音樂要求具有高保真度和立體感等要求踢俄。音頻編碼最常見的是MPEG的音頻編碼缩功。
語音的編碼技術(shù)通常分為三類:波形編碼、參量編碼和混合編碼都办。其中嫡锌,波形編碼和參量編碼是兩種基本類型虑稼。
波形編碼是將時(shí)間域信號直接變換為數(shù)字代碼,力圖使重建語音波形保持原語音信號的波形形狀势木。波形編碼的基本原理是在時(shí)間軸上對模擬語音按一定的速率抽樣蛛倦,然后將幅度樣本分層量化,并用代碼表示啦桌。解碼是其反過程溯壶,將收到的數(shù)字序列經(jīng)過解碼和濾波恢復(fù)成模擬信號。它具有適應(yīng)能力強(qiáng)震蒋、語音質(zhì)量好等優(yōu)點(diǎn)茸塞,但所用的編碼速率高躲庄,在對信號帶寬要求不太嚴(yán)格的通信中得到應(yīng)用查剖,而對頻率資源相對緊張的移動通信來說,這種編碼方式顯然不合適噪窘。
脈沖編碼調(diào)制(PCM)和增量調(diào)制(△M)笋庄,以及它們的各種改進(jìn)型自適應(yīng)增量調(diào)制(ADM),自適應(yīng)差分編碼(ADPCM)等倔监,都屬于波形編碼技術(shù)直砂。它們分別在64以及16Kbit/s的速率上,能給出高的編碼質(zhì)量浩习,當(dāng)速率進(jìn)一步下降時(shí)静暂,其性能會下降較快。
參量編碼又稱為聲源編碼谱秽,是將信源信號在頻率域或其它正交變換域提取特征參量洽蛀,并將其變換成數(shù)字代碼進(jìn)行傳輸。具體說疟赊,參量編碼是通過對語音信號特征參數(shù)的提取和編碼郊供,力圖使重建語音信號具有盡可能高的可靠性,即保持原語音的語意近哟,但重建信號的波形同原語音信號的波形可能會有相當(dāng)大的差別驮审。這種編碼技術(shù)可實(shí)現(xiàn)低速率語音編碼,比特率可壓縮到2Kbit/s-4.8Kbit/s 吉执,甚至更低疯淫,但語音質(zhì)量只能達(dá)到中等,特別是自然度較低戳玫,連熟人都不一定能聽出講話人是誰熙掺。線性預(yù)測編碼(LPC )及其它各種改進(jìn)型都屬于參量編碼。
混合編碼將波形編碼和參量編碼組合起來量九,克服了原有波形編碼和參量編碼的弱點(diǎn)适掰,結(jié)合各自的長處颂碧,力圖保持波形編碼的高質(zhì)量和參量編碼的低速率,在4-16Kbit/s速率上能夠得到高質(zhì)量的合成語音类浪。多脈沖激勵(lì)線性預(yù)測編碼(MPLPC )载城,規(guī)劃脈沖激勵(lì)線性預(yù)測編碼(KPELPC),碼本激勵(lì)線性預(yù)測編碼(CELP)等都是屬于混合編碼技術(shù)费就。很顯然诉瓦,混合編碼是適合于數(shù)字移動通信的語音編碼技術(shù)。
三力细、無線通信中常見語音編碼
PHS為32kbit/s的ADPCM編碼睬澡,GSM為13kbit/s的規(guī)則脈沖激勵(lì)長期預(yù)測(RPE-LTP)編碼,WCDMA使用的是自適應(yīng)多速率編碼(AMR)眠蚂,cdmA2000使用的是可變速率編碼(IS-773煞聪,IS-127)。
1逝慧、AMR編碼(介紹它的原因是因?yàn)?a target="_blank">手機(jī)中有使用AMR鈴聲)
在3G多媒體通信的發(fā)展過程中昔脯,音視頻編碼有了很大的發(fā)展。1999年初,3GPP采納了由愛立信笛臣、諾基亞云稚、西門子提出的自適應(yīng)多速率(AMR)標(biāo)準(zhǔn)作為第三代移動通信中語音編解碼器的標(biāo)準(zhǔn)。AMR聲碼器采用代數(shù)碼本激勵(lì)線性預(yù)測(ACELP:Algebraic Code Excited Linear Prediction)編碼方式沈堡。AMR標(biāo)準(zhǔn)針對不同的應(yīng)用静陈,分別提出了AMR-NB,AMR-WB和AMR-WB+三種不同的協(xié)議诞丽。AMR-NB應(yīng)用于窄帶鲸拥,而AMR-WB和AMR-WB+則應(yīng)用于寬帶通信中。
?對于手機(jī)鈴聲率拒,AMR-NB對應(yīng)的鈴聲文件擴(kuò)展名是.amr崩泡,AMR-WB對應(yīng)鈴聲文件擴(kuò)展名是.awb。它們不是音樂猬膨,而是錄音得到的原聲角撞。
2、ADPCM編碼
自適應(yīng)差分脈碼調(diào)制(ADPCM)是在差分脈碼調(diào)制(DPCM)的基礎(chǔ)上發(fā)展起來的勃痴。DPCM根據(jù)信號的過去樣值預(yù)測下一個(gè)樣值谒所,并將預(yù)測誤差加以量化、編碼沛申,而后進(jìn)行傳輸劣领,由于預(yù)測誤差的幅度變化范圍小于原信號的幅度變化范圍,因此在相同量化噪聲條件下铁材,DPCM的量化比特?cái)?shù)小于PCM尖淘,從而達(dá)到語音壓縮編碼的目的奕锌。ADPCM與DPCM比較,兩者主要區(qū)別在于ADPCM中的量化器和預(yù)測器采用了自適應(yīng)控制村生。同時(shí)惊暴,在譯碼器中多了一個(gè)同步編碼調(diào)整,其作用是為了在同步級連時(shí)不產(chǎn)生誤差積累趁桃。
20世紀(jì)80年代以來辽话,32kb/s的ADPCM技術(shù)已日趨成熟,并接近PCM的質(zhì)量卫病,但卻節(jié)省一半的信道容量油啤,因而受到重視。1984年CCITT提出G721建議,采用動態(tài)鎖定量化器蟀苛,這是一種具有自適應(yīng)速度控制32kb/s的自適應(yīng)量化器益咬,并將它作為國際標(biāo)準(zhǔn)化的語音編碼方法。1986年又對G721建議進(jìn)行了修正屹逛,稱G726建議础废。
ADPCM不適合作音樂的編碼,常用于錄音罕模。雅馬哈的MMF鈴聲用到MIDI+PCM/ADPCM技術(shù),其中PCM和ADPCM就是模擬音效帘瞭,包括人聲淑掌。
四、各種主流音頻編碼(或格式)的介紹
1蝶念、PCM編碼
PCM(Pulse Code Modulation),即脈沖編碼調(diào)制抛腕,指模擬音頻信號只經(jīng)過采樣、模數(shù)轉(zhuǎn)換直接形成的二進(jìn)制序列媒殉,未經(jīng)過任何編碼和壓縮處理担敌。PCM編碼的最大的優(yōu)點(diǎn)就是音質(zhì)好,最大的缺點(diǎn)就是體積大廷蓉。在計(jì)算機(jī)應(yīng)用中全封,能夠達(dá)到最高保真水平的就是PCM編碼,在CD桃犬、DVD以及我們常見的WAV文件中均有應(yīng)用刹悴。
2、WAVE格式(鈴聲)
這是一種古老的音頻文件格式攒暇,由微軟開發(fā)土匀。WAV對音頻流的編碼沒有硬性規(guī)定,除了PCM之外形用,還有幾乎所有支持ACM規(guī)范的編碼都可以為WAV的音頻流進(jìn)行編碼就轧。WAV可以使用多種音頻編碼來壓縮其音頻流证杭,不過我們常見的都是音頻流被PCM編碼處理的WAV,但這不表示W(wǎng)AV只能使用PCM編碼妒御,MP3編碼同樣也可以運(yùn)用在WAV中躯砰,只要安裝好了相應(yīng)的Decode,就可以欣賞這些WAV了携丁。
在Windows平臺下琢歇,基于PCM編碼的WAV是被支持得最好的音頻格式,所有音頻軟件都能完美支持梦鉴,由于本身可以達(dá)到較高的音質(zhì)的要求李茫,因此,WAV也是音樂編輯創(chuàng)作的首選格式肥橙,適合保存音樂素材魄宏。因此,基于PCM編碼的WAV被作為了一種中介的格式存筏,常常使用在其他編碼的相互轉(zhuǎn)換之中宠互,例如MP3轉(zhuǎn)換成WMA。
3椭坚、 MP3編碼(鈴聲)
MP3予跌,眾所周知也就是MPEG-1 Layer 3,是一個(gè)意圖達(dá)到高的壓縮率同時(shí)又能保持相當(dāng)不錯(cuò)的音質(zhì)的有損音頻格式善茎。Layer 3不是MPEG Layer 1或Layer2的新版券册,只是與它們不同的復(fù)雜的編碼方案。現(xiàn)在有許多可用的MP3編碼器垂涯,其中最高品質(zhì)的莫過于Lame烁焙,同時(shí)它也是開源免費(fèi)的。
MP3技術(shù)上支持多聲道(多于2個(gè)聲道)耕赘,但從未實(shí)施過或者今后也不會了骄蝇。事實(shí)上,你可以編碼源文件為pro logic (II)的多聲道文件變換成立體聲MP3操骡。
MP3有不同的采樣率和比特率(注意比特率并不是量化精度九火,而是代表壓縮比),代表不同的音質(zhì)当娱。網(wǎng)絡(luò)上流行的MP3是44.1KHz采樣率店雅,128Kbps比特率的又沾。下表中列出了不同品質(zhì)的MP3,其中列表示SR(采樣頻率),范圍8KHz~48KHz纯赎,行表示BR(比特率)飘千,范圍8Kbps~320Kbps。
4、OGG編碼(鈴聲)
網(wǎng)絡(luò)上出現(xiàn)了一種叫OggVorbis的音頻編碼掀鹅,號稱MP3殺手!OggVorbis究竟什么來頭呢媒楼?OGG是一個(gè)龐大的多媒體開發(fā)計(jì)劃的項(xiàng)目名稱乐尊,將涉及視頻音頻等方面的編碼開發(fā)。整個(gè)OGG項(xiàng)目計(jì)劃的目的就是向任何人提供完全免費(fèi)多媒體編碼方案划址。OGG的信念就是:OPEN扔嵌!FREE!Vorbis這個(gè)詞匯是特里·普拉特柴特的幻想小說《Small Gods》中的一個(gè)"花花公子"人物名夺颤。這個(gè)詞匯成為了OGG項(xiàng)目中音頻編碼的正式命名痢缎。目前Vorbis已經(jīng)開發(fā)成功,并且開發(fā)出了編碼器世澜。
OggVorbis是高質(zhì)量的音頻編碼方案独旷,官方數(shù)據(jù)顯示:Ogg Vorbis可以在相對較低的數(shù)據(jù)速率下實(shí)現(xiàn)比MP3更好的音質(zhì)。OggVorbis這種編碼也遠(yuǎn)比90年代開發(fā)成功的MP3先進(jìn)寥裂,她可以支持多聲道嵌洼,這意味著什么?這意味著OggVorbis在SACD封恰、DTSCD麻养、DVDAUDIO抓軌軟件的支持下,可以對所有的聲道進(jìn)行編碼俭驮,而不是MP3只能編碼2個(gè)聲道回溺。多聲道音樂的興起,給音樂欣賞帶來了革命性的變化混萝,尤其在欣賞交響時(shí),會帶來更多臨場感萍恕。這場革命性的變化是MP3無法適應(yīng)的逸嘀。
和MP3一樣,OggVorbis是一種靈活開放的音頻編碼允粤,能夠在編碼方案已經(jīng)固定下來后還能對音質(zhì)進(jìn)行明顯的調(diào)節(jié)和新算法的改良崭倘。因此,它的聲音質(zhì)量將會越來越好类垫,和MP3相似司光,OggVorbis更像一個(gè)音頻編碼框架,可以不斷導(dǎo)入新技術(shù)逐步完善悉患。和MP3一樣残家,OGG也支持VBR(可變比特率)。
5售躁、MPC 編碼
MPC(MusePack)高比特率高保真音樂格式坞淮。是另外一個(gè)令人刮目相看的實(shí)力派選手茴晋,它的普及過程非常低調(diào),也沒有什么復(fù)雜的背景故事回窘,她的出現(xiàn)目的就只有一個(gè)诺擅,更小的體積更好的音質(zhì)!MPC以前被稱作MP+啡直,很顯然烁涌,可以看出她針對的競爭對手是誰。但是酒觅,只要用過這種編碼的人都會有個(gè)深刻的印象撮执,就是她出眾的音質(zhì)。
6阐滩、mp3PRO 編碼
2001年6月14日二打,美國湯姆森多媒體公司(ThomsonMultimedia SA)與佛朗赫弗協(xié)會(FraunhoferInstitute)于6月14日發(fā)布了一種新的音樂格式版本,名稱為mp3PRO掂榔,這是一種基于mp3編碼技術(shù)的改良方案继效,從官方公布的特征看來確實(shí)相當(dāng)吸引人。從各方面的資料顯示装获,mp3PRO并不是一種全新的格式瑞信,完全是基于傳統(tǒng)mp3編碼技術(shù)的一種改良,本身最大的技術(shù)亮點(diǎn)就在于SBR(SpectralBand Replication頻段復(fù)制)穴豫,這是一種新的音頻編碼增強(qiáng)算法凡简。它提供了改善低位率情況下音頻和語音編碼的性能的可能。這種方法可在指定的位率下增加音頻的帶寬或改善編碼效率精肃。SBR最大的優(yōu)勢就是在低數(shù)據(jù)速率下實(shí)現(xiàn)非常高效的編碼秤涩,與傳統(tǒng)的編碼技術(shù)不同的是,SBR更像是一種后處理技術(shù)司抱,因此解碼器的算法的優(yōu)劣直接影響到音質(zhì)的好壞筐眷。高頻實(shí)際上是由解碼器(播放器)產(chǎn)生的,SBR編碼的數(shù)據(jù)更像是一種產(chǎn)生高頻的命令集习柠,或者稱為指導(dǎo)性的信號源匀谣,這有點(diǎn)駇idi的工作方式。我們可以看到资溃,mp3PRO其實(shí)是一種mp3信號流和SBR信號流的混合數(shù)據(jù)流編碼武翎。有關(guān)資料顯示,SBR技術(shù)可以改善低數(shù)據(jù)流量下的高頻音質(zhì)溶锭,改善程度約為30%宝恶,我們不管這個(gè)30%是如何得來的,但可以事先預(yù)知這種改善可以讓64kbps的mp3達(dá)到128kbps的mp3的音質(zhì)水平(注:在相同的編碼條件下,數(shù)據(jù)速率的提升和音質(zhì)的提升不是成正比的卑惜,至少人耳聽覺上是這樣的)膏执,這和官方聲稱的64kbps的mp3PRO可以媲美128kbps的mp3的宣傳基本是吻合的。
7露久、WMA(鈴聲)
WMA就是WindowsMedia Audio編碼后的文件格式更米,由微軟開發(fā),WMA針對的不是單機(jī)市場毫痕,而是網(wǎng)絡(luò)征峦。競爭對手就是網(wǎng)絡(luò)媒體市場中著名的RealNetworks。微軟聲稱消请,在只有64kbps的碼率情況下栏笆,WMA可以達(dá)到接近CD的音質(zhì)。和以往的編碼不同臊泰,WMA支持防復(fù)制功能蛉加,她支持通過WindowsMedia Rights Manager加入保護(hù),可以限制播放時(shí)間和播放次數(shù)甚至于播放的機(jī)器等等缸逃。WMA支持流技術(shù)针饥,即一邊讀一邊播放,因此WMA可以很輕松的實(shí)現(xiàn)在線廣播需频,由于是微軟的杰作丁眼,因此,微軟在Windows中加入了對WMA的支持昭殉,WMA有著優(yōu)秀的技術(shù)特征苞七,在微軟的大力推廣下,這種格式被越來越多的人所接受挪丢。
8蹂风、RA
RA就是RealAudio格式,這是各位網(wǎng)蟲接觸得非常多的一種格式乾蓬,大部分音樂網(wǎng)站的在線試聽都是采用了RealAudio硫眨,這種格式完全針對的就是網(wǎng)絡(luò)上的媒體市場,支持非常豐富的功能巢块。最大的閃爍點(diǎn)就是這種格式可以根據(jù)聽眾的帶寬來控制自己的碼率,在保證流暢的前提下盡可能提高音質(zhì)巧号。RA可以支持多種音頻編碼族奢,包括ATRAC3。和WMA一樣丹鸿,RA不但都支持邊讀邊放越走,也同樣支持使用特殊協(xié)議來隱匿文件的真實(shí)網(wǎng)絡(luò)地址,從而實(shí)現(xiàn)只在線播放而不提供下載的欣賞方式。這對唱片公司和唱片銷售公司很重要廊敌,在各方的大力推廣下铜跑,RA和WMA是目前互聯(lián)網(wǎng)上,用于在線試聽最多的音頻媒體格式骡澈。
9锅纺、APE
APE是Monkey'sAudio提供的一種無損壓縮格式。Monkey'sAudio提供了Winamp的插件支持肋殴,因此這就意味著壓縮后的文件不再是單純的壓縮格式囤锉,而是和MP3一樣可以播放的音頻文件格式。這種格式的壓縮比遠(yuǎn)低于其他格式护锤,但能夠做到真正無損驱入,因此獲得了不少發(fā)燒用戶的青睞拾因。在現(xiàn)有不少無損壓縮方案種蠢熄,APE是一種有著突出性能的格式,令人滿意的壓縮比以及飛快的壓縮速度,成為了不少朋友私下交流發(fā)燒音樂的唯一選擇劫窒。
10檬果、AMR(鈴聲)
AMR(Adaptive Multi-Rate)自適應(yīng)多速率編碼。是一種應(yīng)用在手機(jī)上的一種語音壓縮格式钝的,也就是說我們用手機(jī)錄音而成的文件就是這種格式的翁垂。AMR格式壓縮率較高但是音質(zhì)相對較差了一點(diǎn)。優(yōu)點(diǎn)就是我們可以隨心所欲地錄制硝桩。
11沿猜、AAC/AAC+
?什么是AAC?
AAC代表AdvancedAudio Coding(高級音頻解碼),是一種由MPEG-4標(biāo)準(zhǔn)定義的有損音頻壓縮格式碗脊,由Fraunhofer發(fā)展啼肩,Dolby,Sony和AT&T是主要的貢獻(xiàn)者。它被認(rèn)為是MP3的繼承者衙伶。AAC能夠在一條音軌中包括48條全帶寬(直到96khz)音頻聲道祈坠,加上15條低頻增強(qiáng)(LFE,限制到120Hz)聲道矢劲,直到15條數(shù)據(jù)流并且更多颁虐。
其實(shí),AAC的技術(shù)早在1997年就成型了卧须,當(dāng)時(shí)被稱為MPEG-2 AAC,但是隨著2000年MPEG-4音頻標(biāo)準(zhǔn)的出臺,MPEG-2 AAC被用在這一標(biāo)準(zhǔn)中花嘶,同時(shí)追加了一些新的編碼特性笋籽,所以它就改稱為MPEG-4 AAC。與MP3不同椭员,AAC的技術(shù)掌握在多家廠商手中车海,這使得AAC編碼器非常多,既有純商業(yè)的編碼器隘击,也有完全免費(fèi)的編碼器侍芝。純商業(yè)的編碼器如Fraunhofer IIS的FhG、杜比公司的Dolby AAC埋同,免費(fèi)的有Free AAC州叠、蘋果公司的iTune,Nero也通過它的Nero 6提供了Nero AAC凶赁。
AAC是一種高壓縮比的音頻壓縮算法咧栗,它的壓縮比可達(dá)20:1,遠(yuǎn)遠(yuǎn)超過了AC-3虱肄、MP3等較老的音頻壓縮算法致板。一般認(rèn)為,AAC格式在96Kbps碼率的表現(xiàn)超過了128Kbps的MP3音頻咏窿。AAC另一個(gè)引人注目的地方就是它的多聲道特性斟或,它支持1~48個(gè)全音域音軌和15個(gè)低頻音軌。除此之外集嵌,AAC最高支持96KHz的采樣率萝挤,其解析能力足可以和DVD-Audio的PCM編碼相提并論,因此纸淮,它得到了DVD論壇的支持平斩,成為了下一代DVD的標(biāo)準(zhǔn)音頻編碼。
AAC的家族非常龐大咽块,有9種規(guī)格绘面,可適應(yīng)不同場合應(yīng)用的需要。其中LC低復(fù)雜性規(guī)格去掉了預(yù)測和增益控制模塊侈沪,降低了復(fù)雜度揭璃,提高編碼效率,是目前使用得最多的規(guī)格亭罪。
目前瘦馍,蘋果、AT&T和RealNetworks已經(jīng)開始提供收費(fèi)的AAC音樂下載服務(wù)应役。AAC也得到了眾多硬件廠商的支持情组,除了蘋果的iPOD隨身聽燥筷,還有諾基亞的多款手機(jī)及松下的部分隨身聽產(chǎn)品可支持AAC音頻的播放。另外院崇,目前已經(jīng)有部分MPEG-1/2解碼芯片中加入了AAC解碼功能肆氓,出現(xiàn)支持AAC音頻播放的DVD影碟機(jī)肯定是遲早的事情。
?什么是HE-AAC(也稱AAC+)和LC-AAC底瓣?
AAC有兩種LC AAC與HE AAC谢揪,HE AAC是較新的。LC意思是"low complexity"(低復(fù)雜性)而HE意思是 "high efficiency"(高效性)捐凭。
HE-AAC也稱之為AAC SBR/AAC+/aacplus等拨扶。注意HE-AAC注重于低碼流的編碼并很適合多聲道文件(更小的文件尺寸)。
從學(xué)術(shù)上講茁肠,HE-AAC混合了AAC與SBR技術(shù)患民,處理低比特率能有較好的效果。SBR代表的是SpectralBandReplication(頻段復(fù)制)官套。SBR的關(guān)鍵是在低碼流下提供全帶寬的編碼而不會產(chǎn)生產(chǎn)生多余的信號酒奶。傳統(tǒng)認(rèn)為音頻編碼在低碼流下意味著減少帶寬和降低采樣率或產(chǎn)生令人不快的噪音信號。SBR解決問題的方法是讓核心編碼去編碼低頻信號奶赔,而SBR解碼器通過分析低頻信號產(chǎn)生高頻信號和一些保留在比特流中的指導(dǎo)信號(通常碼流極低惋嚎,~2kbps)。這也是為什么被叫做Spectral BandReplication的原因站刑,它只是增加音頻的帶寬另伍,而非重建。(類似的技術(shù)也用在mp3 pro64kbps能媲美128kbps的mp3就是這道理)
?MP4與AAC
MP4最初是一種音頻格式绞旅,和MPEG-4沒有太大的關(guān)系摆尝,就像MP3和MPEG-3沒有關(guān)系一樣。MP3是MPEG-1Audio Layer 3 的縮寫因悲;而MP4是MPEG-2 AAC堕汞,完完全全是一種音頻壓縮格式,增加了諸如對立體聲的完美再現(xiàn)晃琳、多媒體控制讯检、降噪等新特性,最重要的是卫旱,MP4通過特殊的技術(shù)實(shí)現(xiàn)數(shù)碼版權(quán)保護(hù)人灼,這是MP3所無法比擬的。
現(xiàn)在市面上的MP4多數(shù)偏向于多媒體播放器顾翼,能夠播放AAC的投放,可以說是鳳毛麟角。甚至有媒體把MP4說成是MPEG4的縮寫适贸,這在以前看來是一個(gè)謬論灸芳,但是經(jīng)過商家不斷的炒作涝桅,這個(gè)謬論也就成為了真理。現(xiàn)在若果你去電腦城聽到MP4這個(gè)詞耗绿,絕對是能播放視頻格式的多媒體播放器的概念苹支,而不是能播放音頻MP4AAC的隨身聽。出現(xiàn)這種怪現(xiàn)象不是毫無原因的误阻,上面已提到AAC有版權(quán)保護(hù)功能,這也是眾多唱片公司支持AAC的原因晴埂,要使自己的播放器支持AAC究反,還得支持付一定的版權(quán)費(fèi)或?qū)@M(fèi),另外儒洛,AAC的來源也是個(gè)問題精耐,不像MP3那么開放,網(wǎng)上來源極少琅锻,所以目前音頻MP4播放器發(fā)展尚不成熟卦停,鑒于以上現(xiàn)狀,眾商家干脆“借尸還魂”恼蓬,把MP4等同MPEG-4縮寫而論惊完,這樣也恰好應(yīng)了MP4是MP3的下一代這條規(guī)律,除了支持MP3所具有的音樂播放功能外处硬,還具備強(qiáng)大的MPEG-4視頻播放能力小槐,另外,恰好“4”在“3”后荷辕,從這點(diǎn)出發(fā)凿跳,把MP4等同MPEG-4是合理的。
第三部分??和弦鈴聲格式
與音樂不同的是疮方,和弦鈴聲都是制作出來的控嗜。播放的時(shí)候,只需要合成(或解碼)就可以輸出PCM格式的數(shù)據(jù)骡显,然后PCM格式的數(shù)據(jù)可以通I2S接口傳輸疆栏,然后經(jīng)過數(shù)-模轉(zhuǎn)換輸出。
1蟆盐、??MIDI合成音樂
?什么是MIDI承边?
MIDI(Musical Instrument Digital Interface)音樂設(shè)備數(shù)字化接口,也稱為數(shù)字音序石挂〔┲“MIDI”文件(*.MID)不是聲音文件,不是一段錄制好的聲音,而是記錄聲音的信息痹愚,然后再告訴聲卡如何再現(xiàn)音樂的一組指令富岳』着矗可以做這樣的比喻:如果數(shù)字音頻是一個(gè)人獨(dú)奏吉它時(shí)的錄音帶,MIDI文件則相當(dāng)于該獨(dú)奏曲的樂譜窖式。雖然樂譜本身不能產(chǎn)生出任何實(shí)際的聲音來蚁飒,但是樂譜確定了音樂演奏得有多快,撥哪個(gè)音符萝喘,以及應(yīng)該用多大的力度彈奏吉它淮逻。
我們可以從以下幾點(diǎn)說明“MIDI”文件(*.MID)的特性:
1. 首先,正如上所說,它不是聲音文件,只是一組指導(dǎo)聲卡如何發(fā)聲的指令,因此它生成的文件比較小阁簸。
2.它只能應(yīng)用于電子音樂設(shè)備(如電腦聲卡等)爬早,而不能應(yīng)用于人聲。原因很簡單启妹,它發(fā)出的聲音只能來自聲卡中的內(nèi)置音源(例如波表ROM中存儲的音色)筛严。自然界中那么豐富的音樂的和非音樂的聲音,都是不能包括在內(nèi)的饶米。要在MIDI中混合自然界的模擬音效桨啃,一般是在在MIDI上疊加PCM/ADPCM。
3.midi格式是記錄每個(gè)音的音色檬输、音名照瘾、響度、角度褪猛、時(shí)間等网杆,根據(jù)記錄查詢音色庫,得到應(yīng)發(fā)聲音伊滋。簡單的說碳却,每個(gè)音軌對應(yīng)一種樂器,上面以特定的格式記錄每時(shí)刻該樂器所演奏的樂音笑旺。比如昼浦,在某時(shí)刻被定義為鋼琴的音軌上記錄著上面所說的135組成的和弦,那么芯片就查詢音色庫得到所對應(yīng)的音效筒主,然后合成关噪、播放。所以音色庫是關(guān)系midi是否動聽的關(guān)鍵因素乌妙,好的音色庫是很占地方的使兔。手機(jī)中記錄音樂的方法與電腦上的midi相同或相似,不同的是它所記錄的全是單音藤韵,而復(fù)雜的和弦音效沒有記錄虐沥。手機(jī)和弦芯片中的音色庫都預(yù)先存儲在內(nèi)置的波表ROM中。
?MIDI的分類:
MIDI格式后綴名是.MID,但其有MIDI0欲险、MIDI1镐依、MIDI2、SP-MIDI天试、XGMIDI等多種規(guī)范槐壳。
MIDI0和MIDI1:MIDI0是單音軌,MIDI1是多音軌喜每。手機(jī)的和弦數(shù)目等于midi格式中的音軌數(shù)务唐,手機(jī)的每個(gè)音軌都是單音音軌。網(wǎng)上的絕大多數(shù)MIDI音樂都是多音軌的带兜。另外绍哎,MIDI0的讀入和處理速度要快些,有的硬件可以直接讀軟盤上的MIDI文件回放(即時(shí)回放)鞋真,而MIDI1的做不到。
SMF(Standard MIDI Format):是標(biāo)準(zhǔn)的MIDI格式沃于,SMF分為format0和format1兩種格式涩咖,即MIDI0和MIDI1。
SP-MIDI:MIDI協(xié)會(MMA)推出一個(gè)新的規(guī)定Scalable Polyphony MIDI(簡稱SP-MIDI)繁莹,大概可以譯成“可升級的MIDI復(fù)音”檩互。據(jù)介紹,這個(gè)規(guī)定主要作用是當(dāng)合成器或音源的同時(shí)發(fā)音數(shù)小于作品的要求時(shí)咨演,可以根據(jù)作曲家的事先決定省略某些音符或聲部闸昨。例如一部為GM2音源寫作的作品(要求32復(fù)音)在GM1或GM Lite音源上演奏的時(shí)候,由于同時(shí)發(fā)音數(shù)不足薄风,必然有一些音符被忽略掉饵较。過去這個(gè)決定權(quán)在機(jī)器方面,帶有隨機(jī)的性質(zhì)遭赂,可能把樂曲搞得殘缺不全⊙撸現(xiàn)在依據(jù)“可升級的MIDI復(fù)音”規(guī)定,控制權(quán)轉(zhuǎn)移到作曲家手中撇他,創(chuàng)作音樂的時(shí)候就可以設(shè)計(jì)好不同的“樂隊(duì)編制”茄猫,使MIDI樂曲的正確演奏更有保證。另外困肩,SP-MIDI標(biāo)準(zhǔn)為使用MIDI消息實(shí)現(xiàn)對振動提示的控制定義了一種可選方法划纽, SP-MIDI內(nèi)容中可以同時(shí)含有音頻和振動兩種表現(xiàn)形式。振動控制被定義為弦樂器锌畸。
?什么是音樂合成技術(shù)勇劣?
音樂合成的途徑
1.采樣合成(波表合成):這是最常見的音樂合成方式,為了得到鋼琴聲蹋绽,就把鋼琴在不同音階下發(fā)出的聲音錄制保存下來芭毙,當(dāng)播放音樂需要鋼琴聲時(shí)筋蓖,錄制下來的樣本被調(diào)用并通過計(jì)算來獲得正確的音符。其缺點(diǎn)是需要許多存儲空間來保存高質(zhì)量的聲音樣本退敦。例如粘咖,大多數(shù)PC使用采樣合成,其波表將占用8MB或更多存儲空間侈百,這對移動電話電話來說是一個(gè)非常大的開銷瓮下。
2. 波譜匹配:Yamaha的調(diào)頻合成(FM合成)同潤威公司的GAP都屬于這種類型。這種方式包括找到一個(gè)數(shù)學(xué)公式來調(diào)制樂器聲音輸出使得其像真正的樂器那樣钝域。這種方式使用很少的系統(tǒng)開銷讽坏,同時(shí)也比采樣合成使用的存儲空間少很多。
?MIDI的三個(gè)標(biāo)準(zhǔn):GS例证、GM路呜、XG
?音樂的要素之一是音色。在MIDI中织咧,一種樂器就是一種音色(Patch,Program和Timbre)≌痛校現(xiàn)實(shí)的情況是不同的合成器和音源的制造者為了使自己的產(chǎn)品有獨(dú)特之處,總是開發(fā)出若干種特殊音色笙蒙,因而不同品牌的設(shè)備在音色種類和音色排列順序方面會大不相同抵屿。這就導(dǎo)致了一個(gè)缺陷的出現(xiàn):使用甲合成器制作的MIDI文件,換了乙合成器就不能正確播放捅位。其原因在于甲合成器上01號音色可能是鋼琴轧葛,而在乙合成器上,01號音色可能是打擊樂或其他音色艇搀∧虺叮總而言之。每一種MIDI設(shè)備的音色設(shè)置(以及其他方面)都具有排他性中符。這就使音樂家受到了設(shè)備的制約姜胖。為了有利于音樂家廣泛地使用不同的合成器設(shè)備和促進(jìn)MIDI文件的交流,MIDI協(xié)會(MMA)于1991年制訂了“通用MIDI”(GM)標(biāo)準(zhǔn)淀散。該標(biāo)準(zhǔn)以日本Roland公司的通用合成器(GS)標(biāo)準(zhǔn)為基礎(chǔ)而制訂右莱。
值得注意的是,雖然現(xiàn)在有了國際通用的GM標(biāo)準(zhǔn)可供電子樂器生產(chǎn)廠家參照档插,但仍有另外兩個(gè)標(biāo)準(zhǔn)與GM標(biāo)準(zhǔn)共存慢蜓,一個(gè)是GS標(biāo)準(zhǔn),為Roland公司的產(chǎn)品所專用郭膛,它產(chǎn)生于GM標(biāo)準(zhǔn)出現(xiàn)之前晨抡,也是GM的前身。另一個(gè)是后來出現(xiàn)的XG標(biāo)準(zhǔn),為YAMAHA公司的產(chǎn)品所專用耘柱。
1如捅、GS標(biāo)準(zhǔn)。
GS為General??Synthesizer的縮寫调煎,意為“通用合成器”镜遣,是羅蘭公司創(chuàng)立的一種MIDI標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)具有有以下五種主要功能:1)16個(gè)聲部士袄。2)最大復(fù)音數(shù)為24或更多悲关。3)GS格式的樂器音色排列,該格式包含有各種不同風(fēng)格的音樂所使用的樂器音色和打擊樂音色娄柳。4)鼓音色可以通過音色改變信息進(jìn)行選擇寓辱。5)包含兩種可調(diào)節(jié)的效果,有混響和合唱赤拒。
2秫筏、GM標(biāo)準(zhǔn)。 GM是 General??MIDI Mode(通用MIDI)的縮寫挎挖,即GMM跳昼,通常縮寫為GM肋乍。該標(biāo)準(zhǔn)是MIDI協(xié)會以羅蘭公司的通用合成器(GS)標(biāo)準(zhǔn)為基礎(chǔ)而建立的標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)為一般合成器所共有的128種樂器音色(分成16組)規(guī)定了序號敷存,將47種標(biāo)準(zhǔn)的非旋律性打擊樂器分配在第10通道墓造,并為這47種打擊樂器規(guī)定了音符序號(35(B2)-81(A6))。以下是GM標(biāo)準(zhǔn)的128種音色分類表:
?3锚烦、XG標(biāo)準(zhǔn)觅闽。XG-MIDI是Extended??General??MIDI(擴(kuò)展的通用MIDI)的縮寫。XG是繼GM標(biāo)準(zhǔn)建立之后涮俄,雅馬哈公司于1994年推出的新的音源控制規(guī)格蛉拙。XG在保持與GM兼容的同時(shí),又增加了許多新的功能彻亲,其中包括音色庫(音色數(shù)量)的增加孕锄,和啟用更多的控制器對音色亮度等方面進(jìn)行控制等等。
2苞尝、SMAF格式(文件擴(kuò)展名.MMF)
合成音樂移動應(yīng)用格式(Syntheticmusic Mobile ApplicationFormat畸肆,縮寫為SMAF),是雅馬哈公司首創(chuàng)的一種移動電話內(nèi)容標(biāo)準(zhǔn)宙址,是目前手機(jī)上使用非常多的和弦鈴聲轴脐,網(wǎng)絡(luò)上有非常多的鈴聲資源可供下載。最常見的為MA2,MA3大咱,MA5恬涧。MA2對應(yīng)16和弦,MA3對應(yīng)40和弦碴巾,MA5對應(yīng)64和弦溯捆。與MIDI相比,它采用了MIDI+PCM/ADPCM的技術(shù)餐抢,故而支持真人鈴聲现使。
3、VMD
VMD技術(shù)是針對手機(jī)平臺的新一代多媒體技術(shù)旷痕,該技術(shù)可以用于制作鈴聲碳锈、音樂、卡拉OK欺抗、動畫售碳、移動電視、流媒體播放等绞呈,為手機(jī)用戶提供完美的多媒體體驗(yàn)贸人。這標(biāo)志著移動多媒體應(yīng)用產(chǎn)業(yè)鏈的核心技術(shù)層面已經(jīng)取得了關(guān)鍵性的突破,業(yè)內(nèi)人士認(rèn)為它將成為未來多媒體手機(jī)的新趨勢佃声。以鈴聲應(yīng)用為例艺智,目前普遍采用的MIDI播放效果受播放器或合成器的限制,由于文件尺寸較小無法嵌入人聲圾亏、水聲(wave或mp3)等自然界的聲音十拣,表現(xiàn)力不足;而WAVE和MP3文件格式可以保存自然界和樂器的聲音志鹃。但MP3需要快速解碼夭问,WAVE也需要格式轉(zhuǎn)換。VMD格式中對MIDI音樂指令作了全面優(yōu)化——這種格式對MIDI的指令合并精簡曹铃,在保留完全相同音質(zhì)的情況下缰趋,使得MIDI音樂指令的長度更芯氩住媳谁;VMD文件的組織結(jié)構(gòu)也經(jīng)過專門設(shè)計(jì),使得文件組織模塊化紧唱,從多軌轉(zhuǎn)換為單軌评甜,在這方面比其它格式更適合硬件平臺處理直撤。在文件格式上VMD吸取了SMIL等規(guī)范的優(yōu)點(diǎn),使得VMD-MIDI和WAV蜕着、MP3谋竖、JPEG等數(shù)據(jù)可以保留原有存儲方式红柱,也可以獨(dú)立解析;MIDI部分不包含專門針對合成器硬件的繁瑣的控制信息蓖乘,能夠廣泛地被合成器廠商支持锤悄;VMD格式中對歌詞、版權(quán)等文本信息使用UNICODE編碼嘉抒,可支持多國語言零聚。此外,在VMD文件中還可以控制手機(jī)的LED和馬達(dá)些侍,實(shí)現(xiàn)聲隶症、光和震動一體化的效果,并嵌入音色庫和音效庫岗宣。
第四部分??單聲道蚂会、立體聲和環(huán)繞聲
一、單聲道(Mono):
所謂的單聲道耗式,就是聲音只由一只音箱產(chǎn)生胁住,聽眾可以很明顯地聽出聲音的來源就是音箱所擺放的位置,其本身的表現(xiàn)力較為平淡刊咳;當(dāng)通過兩個(gè)揚(yáng)聲器回放單聲道信息的時(shí)候彪见,我們可以明顯感覺到聲音是從兩個(gè)音箱正中間傳遞到我們耳朵里的。
二娱挨、立體聲(Stereo):
它利用了兩個(gè)獨(dú)立聲道進(jìn)行錄音余指,整個(gè)過程不加任何的聲音處理。立體聲系統(tǒng)的再現(xiàn)需要一對音箱來完成跷坝,它通過調(diào)整系統(tǒng)中兩只音箱發(fā)出聲音的大小浪规,讓我們誤認(rèn)為聲源來自兩只音箱之間直線段中的任意位置。特別是當(dāng)使用耳機(jī)的時(shí)候探孝,由于左右兩邊的聲音串音情況很少發(fā)生,所以聲音的定位比較準(zhǔn)確誉裆;再加上比較真實(shí)的音場感覺顿颅,它的表現(xiàn)力比單聲道真實(shí)得多。但(Stereo)的缺陷也十分明顯足丢,最明顯就是對音箱的位置擺放要求較高粱腻,擺位的不好會直接影響聲音的表達(dá)。
四斩跌、3D環(huán)繞聲 (3D Surround)
有時(shí)也稱作3D增強(qiáng)立體聲(3D Enhancement)绍些。它是一種模擬環(huán)繞聲系統(tǒng)。左耀鸦、右聲道的立體聲信號柬批,經(jīng)過數(shù)字信號處理后啸澡,通過左、右兩路音箱氮帐,產(chǎn)生三維的環(huán)繞聲場效果嗅虏。它使用一般雙聲道創(chuàng)建一個(gè)具有三維感覺的環(huán)繞聲音場,比立體聲好上沐,但與編碼式環(huán)繞系統(tǒng)有相當(dāng)?shù)牟罹嗥し3R姷挠蠸RS實(shí)驗(yàn)室的SRSWOW、Q-sound實(shí)驗(yàn)室的Qxpander参咙、Spatializer實(shí)驗(yàn)室的Spatializer 3D等技術(shù)龄广,主要針對普通雙聲道立體聲信號進(jìn)行處理,對于杜比環(huán)繞聲信號不作解碼蕴侧,采用強(qiáng)制處理的方式择同,顯而易見不可能處理AC-3信號。
五戈盈、環(huán)繞聲系統(tǒng)與虛擬環(huán)繞聲(Virtual Surround):
比較出名的有杜比AC-3(也稱DolbyDigital奠衔,杜比數(shù)字)、DTS(Digital TheaterSystem塘娶,數(shù)字影院系統(tǒng))归斤、THX家庭影院系統(tǒng)。以著名的AC-3杜比數(shù)碼環(huán)繞聲系統(tǒng)為例刁岸。杜比實(shí)驗(yàn)室在1991年開發(fā)出一種杜比數(shù)碼環(huán)繞聲系統(tǒng)(Dolby??Surround??DigitaI),??即AC-3系統(tǒng)脏里。??AC-3杜比數(shù)碼環(huán)繞聲系統(tǒng)由5個(gè)完全獨(dú)立的全音域聲道和一個(gè)超低頻聲道組成,??有時(shí)又將它們稱為5.1聲道。??其中5個(gè)獨(dú)立聲道為:??前置左聲道虹曙、前置右聲道迫横、中置聲道、環(huán)繞左聲道和環(huán)繞右聲道酝碳;??另外還有一個(gè)專門用來重放120Hz以下的超低頻聲道,??即0.1聲道矾踱。
在環(huán)繞聲的實(shí)現(xiàn)上,無論是杜比AC3還是DTS疏哗,都有一個(gè)特點(diǎn)呛讲,就是回放時(shí)需要多個(gè)音箱,一般一個(gè)聲道對應(yīng)至少一個(gè)音箱返奉,比如用杜比數(shù)字系統(tǒng)贝搁,起碼需要5個(gè)全音頻范圍的音箱,再加上一個(gè)低音炮芽偏,由于價(jià)格及空間方面的原因雷逆,有的消費(fèi)者,如多媒體電腦的用戶污尉,并沒有足夠的音箱膀哲,這時(shí)候就需要一種技術(shù)往产,能夠把多聲道的信號經(jīng)過處理,在兩個(gè)平行放置的音箱中回放出來等太,并且能夠讓人感覺到環(huán)繞聲的效果捂齐,這就是虛擬環(huán)繞聲技術(shù)。
與3D環(huán)繞技術(shù)不同的是缩抡,它是對杜比類環(huán)繞聲信號進(jìn)行解碼奠宜,再利用單耳效應(yīng)和雙耳效應(yīng)對環(huán)繞聲信號進(jìn)行虛擬化處理,盡管僅有兩個(gè)重放聲道瞻想,但讓聽眾感到多聲道效果压真,即產(chǎn)生所謂的揚(yáng)聲器虛擬幻像。虛擬環(huán)繞聲技術(shù)主要有SRS公司的SRSTruSurround蘑险、Q-sound公司的Qsurround滴肿、Aureal公司的A3D、Spatializer公司的N-2-2DVS等技術(shù)佃迄,當(dāng)然還有杜比實(shí)驗(yàn)室的杜比虛擬環(huán)繞聲VSS(VirtualSurround Sound)技術(shù)泼差,非杜比實(shí)驗(yàn)室的技術(shù)一般也獲得了杜比實(shí)驗(yàn)室的認(rèn)可,可以用于回放杜比定向邏輯和杜比數(shù)字信號呵俏。??? ?? ?? ?? ?? ?? ?? ?
第五部分??3D環(huán)繞聲技術(shù)
在MP3中用到的最多的音效有BBESound的BBE音效和SRS實(shí)驗(yàn)室的SRS音效堆缘。在音樂芯片F(xiàn)T1960中采用了SRS公司的 WOW XT SurrondSound技術(shù);在松下的立體聲功放AN12974A中采用了Spatializer 3D技術(shù)普碎;在雅嗎哈的YMU788芯片中采用了DVX技術(shù)吼肥。
一、SRS音效
這里介紹SRS實(shí)驗(yàn)室的SRSWOW(立體聲增強(qiáng)技術(shù))麻车。SRSLabs根據(jù)人類聽覺的基本元素缀皱,開發(fā)出“心理聲音”(psychoacoustic)音響技術(shù),包括SRS(環(huán)繞聲)动猬、TrueBass(低音增強(qiáng))啤斗、FOCUS(聲場提升)及WOW(Trubass+SRS),讓人類感覺到受器材限制而聽不出的聲音赁咙。
現(xiàn)在MP3播放器所用的SRS音效是SRS WOW钮莲,它由SRS(環(huán)繞聲), TruBass(低音增強(qiáng))和FOCUS(聲場提升)組成。
官方對WOW的描述如下(可能翻譯的并不準(zhǔn)確):
?WOW:可以突破小型揚(yáng)聲器和耳機(jī)的固有局限序目,通過提供3D音頻圖象在水平及垂直方位上擴(kuò)展聲音使其超越器材本身的能力。這樣伯襟,小型音頻設(shè)備猿涨,電視,無線和個(gè)人/便攜產(chǎn)品的制造商不用增大揚(yáng)聲器尺寸便可顯著改善其產(chǎn)品的聲響效果姆怪。特別在諸如MP3叛赚,WMA和音頻CD這些經(jīng)數(shù)碼壓縮使空間感被極大削弱的單聲道或立體聲音頻格式上澡绩,WOW的修飾效果尤其顯著。
?SRS:SRS能恢復(fù)被傳統(tǒng)錄制和播放設(shè)備掩蓋住的空間信息俺附。通過將立體聲信號分解為多個(gè)部分肥卡,它可以分離并恢復(fù)空間信號或原始錄音所呈現(xiàn)的環(huán)境信息。 并且把它們放在直接聲音的正呈铝停空間步鉴。這些空間信號被專利幅頻響應(yīng)校正曲線所處理。這樣璃哟,再現(xiàn)的聲音會非常接近藝術(shù)家最初設(shè)想的那種現(xiàn)場效果氛琢。SRS沒有所謂的最佳聽音位置(sweet spot),因此随闪,音樂和聲音好像充滿了房間阳似,使聽者完全處在全三維聲音包圍中。
?TruBass:TruBass是一種SRS專利技術(shù)铐伴,運(yùn)用人類聲音心理學(xué)專利技術(shù)來增強(qiáng)低音性能撮奏。這些技術(shù)能利用原始音源中表現(xiàn)的和聲再現(xiàn)低頻信息〉毖纾恢復(fù)基本低頻音調(diào)的感覺- 即使該信息低于揚(yáng)聲器和耳機(jī)的低頻極限畜吊。因此TruBass可以呈現(xiàn)出比小型、中型和大型揚(yáng)聲器和耳機(jī)的低頻極限還低八度即供,并且深邃豐富的聽感定拟。
?FOCUS:FOCUS通過提升聲場來生成聲音圖象的高度感。當(dāng)于SRS 3D結(jié)合時(shí)逗嫡,F(xiàn)OCUS會放大聲音圖像青自,產(chǎn)生一個(gè)非常高廣,最佳聽音位置(sweet spot)寬廣的聲場驱证。另外延窜,F(xiàn)OCUS能改善高頻通透度讓聽者沉浸其中。在揚(yáng)聲器低于音場的產(chǎn)品中抹锄,比如內(nèi)投影電視或固定在門板上的汽車揚(yáng)聲器逆瑞,F(xiàn)OCUS將可用電子學(xué)方法調(diào)節(jié)重新將聲場定位于聽者前方的最佳位置上。
二伙单、BBE音效
BBE音效的3D環(huán)繞立體聲技術(shù)包括获高, BBE、BBE MacH3Bass吻育、BBE MP三種念秧。
Ø? BBE系統(tǒng)具有兩個(gè)基本功能,其中之一是調(diào)節(jié)低布疼、中和高頻相位之間的關(guān)系摊趾。第二個(gè)功能是增強(qiáng)了高頻和低頻信號币狠。此外,BBE還具有靜噪功能砾层。BBE電路內(nèi)部設(shè)有噪聲門和高截止濾波器漩绵,能對輸入的雜散信號進(jìn)行衰減。
Ø?
?BBEMach3Bass用電子學(xué)方法擴(kuò)展特定擴(kuò)音器的低音響應(yīng)并能精確調(diào)整需要的低頻極限肛炮。在世界知名的BBE處理相位誤差校正技術(shù)的幫助下止吐,BBEMach3Bass可提供比標(biāo)準(zhǔn)低音提升電量更深,更密铸董,更精確的低音頻率祟印。BBEMach3Bass不影響中低段聲音,否則會在中低頻段產(chǎn)生混濁并改變角色的嗓音粟害。
Ø?
?? ?? BBE MP (最小化多項(xiàng)非線性飽和)技術(shù)通過數(shù)字壓縮復(fù)原和增強(qiáng)諧波損失蕴忆,進(jìn)而提高經(jīng)數(shù)字壓縮處理的音頻(如MP3)音效。BBEMP從原始資料中復(fù)原聲音悲幅,因而有效地恢復(fù)聲音的溫暖感套鹅、細(xì)膩感和細(xì)微差別。BBEMP可將聲級平均提高3個(gè)分貝汰具,同時(shí)保持峰間搖擺不變卓鹿。由于聲音輸出高出3個(gè)分貝,信噪比也相應(yīng)地得到了改善留荔。
通過上面技術(shù)描述的對比可以發(fā)現(xiàn)吟孙,雖然都可以提升低音,但兩者對音樂的實(shí)質(zhì)影響是完全不同的聚蝶,SRS WOW帶給音樂的改變是在空間感方面杰妓,就是聽上去感覺聲音范圍更大了,而BBE提高聲音的清晰度碘勉,整個(gè)聲場強(qiáng)度都上了個(gè)臺階巷挥。
三、Spatializer 3D
? ?Spatializer實(shí)驗(yàn)室的3D增強(qiáng)技術(shù)验靡。具體不詳倍宾。
四、DVX技術(shù)
日本DiMAGIC公司的DiMAGICVirtu-alizerX(DVX)環(huán)繞立體聲技術(shù)胜嗓。具體不詳高职。
第六部分??數(shù)字音頻格式和數(shù)字音頻接口
一、數(shù)字音頻格式
1辞州、PCM格式及其分類
PCM是未壓縮(無損)的數(shù)字音頻格式怔锌。其采樣速率為可以為6、8、11.025产禾、16、22.05牵啦、32亚情、44.1、48哈雏、64楞件、88.2、96裳瘪、192KHz,采樣精度可以為8土浸、12、13彭羹、16,20, 或24 bits黄伊∨梢螅可以有1到8個(gè)聲道还最。最大比特速率為6.144Mbps毡惜,如果有5個(gè)或更多聲道,這個(gè)最大速率就限制了采樣率和比特位數(shù)拓轻。例如音頻CD為44.1 kHz/16bits/雙聲道;DVD不僅能夠播放2聲道的超高保真音響(192KHz/24bit/雙聲道)经伙,還能播放線性PCM最多6個(gè)聲道的環(huán)繞聲音響(96kHz/24bit/6聲道)扶叉。PCM格式又根據(jù)其量化方式可以分為線性PCM(linear PCM)和非線性PCM(non-linear PCM),前者是均勻量化得到的帕膜,后者是非均勻量化得到的枣氧。
?均勻量化
如果采用相等的量化間隔對采樣得到的信號作量化,那么這種量化稱為均勻量化泳叠。均勻量化就是采用相同的“等分尺”來度量采樣得到的幅度作瞄,也稱為線性量化,如圖6所示危纫。
圖6??均勻量化
?非均勻量化
非線性量化的基本想法是宗挥,對輸入信號進(jìn)行量化時(shí),大的輸入信號采用大的量化間隔种蝶,小的輸入信號采用小的量化間隔契耿,如圖7所示。這樣就可以在滿足精度要求的情況下用較少的位數(shù)來表示螃征。聲音數(shù)據(jù)還原時(shí)搪桂,采用相同的規(guī)則。
在非線性量化中,采樣輸入信號幅度和量化輸出數(shù)據(jù)之間定義了兩種對應(yīng)關(guān)系踢械,一種稱為u律壓擴(kuò)(companding)算法酗电,另一種稱為A律壓擴(kuò)算法。
u律(u-Law)壓擴(kuò)(G.711)主要用在北美和日本等地區(qū)的數(shù)字電話通信中内列。它的輸入和輸出關(guān)系是對數(shù)關(guān)系撵术,所以這種編碼又稱為對數(shù)PCM。A律(A-Law)壓擴(kuò)(G.711)主要用在歐洲和中國大陸等地區(qū)的數(shù)字電話通信中话瞧。A律壓擴(kuò)的前一部分是線性的嫩与,其余部分與u律壓擴(kuò)相同。
對于采樣頻率為8 kHz交排,樣本精度為13位划滋、14位或者16位的輸入信號,使用u律壓擴(kuò)編碼或者使用A律壓擴(kuò)編碼埃篓,經(jīng)過PCM編碼器之后每個(gè)樣本的精度為8位处坪。
圖8? ?非均勻量化
2、DSD音頻格式
PCM脈碼調(diào)制數(shù)字音頻格式是70年代末發(fā)展起來的架专,記錄媒體之一的CD稻薇,80年代初由飛利浦和索尼公司共同推出。PCM的音頻格式也被DVD-A所采用胶征,它支持立體聲和5.1環(huán)繞聲塞椎,1999年由DVD討論會發(fā)布和推出的。
PCM的比特率睛低,從14-bit發(fā)展到16-bit案狠、18-bit、20-bit直到24-bit钱雷;采樣頻率從44.1kHz發(fā)展到192kHz骂铁。到目前為止PCM這項(xiàng)技術(shù)可以改善和提高的方面則越來越來小。只是簡單的增加PCM比特率和采樣率罩抗,不能根本的改善它的根本問題拉庵。其原因是PCM的主要問題在于:
1)任何PCM數(shù)字音頻系統(tǒng)需要在其輸入端設(shè)置急劇升降的濾波器,僅讓20 Hz - 22.05 kHz的頻率通過(高端22.05kHz是由于CD 44.1kHz的一半頻率而確定)套蒂,這是一項(xiàng)非常困難的任務(wù)钞支。
2)在錄音時(shí)采用多級或者串聯(lián)抽選的數(shù)字濾波器(減低采樣率),在重放時(shí)采用多級的內(nèi)插的數(shù)字濾波器(提高采樣率)操刀,為了控制小信號在編碼時(shí)的失真烁挟,兩者又都需要加入重復(fù)定量噪聲。這樣就限制了PCM技術(shù)在音頻還原時(shí)的保真度骨坑。
為了全面改善PCM 數(shù)字音頻技術(shù)撼嗓,獲得更好的聲音質(zhì)量,就需要有新的技術(shù)來替換。近年來飛利浦和索尼公司再次聯(lián)手且警,共同推出一種稱為直接流數(shù)字編碼技術(shù)DSD的格式, 其記錄媒體為超級音頻CD即SACD粉捻,支持立體聲和5.1環(huán)繞聲。
DSD音頻格式簡化了信號流程斑芜,去掉了PCM使用的多級濾波器杀迹,將模擬音頻直接以2.8224MHz的高采樣頻率,按1-bit的數(shù)字脈沖來記錄押搪。雖然DSD格式表示的聲音信號是數(shù)字化數(shù)據(jù),但是它又與真正的聲波非常接近浅碾,可完整的記錄當(dāng)今最佳模擬系統(tǒng)的信息大州。最好的30ips半英寸模擬錄音機(jī)能記錄的頻率能超過50KHz,而DSD格式的頻率響應(yīng)指標(biāo)為從DC到100KHz垂谢。能覆蓋高級模擬調(diào)音臺的動態(tài)范圍厦画,通過其音頻頻段的剩余噪聲功率,保持在-120dB滥朱。DSD的頻率響應(yīng)和動態(tài)范圍根暑,是任何數(shù)字和模擬的錄音系統(tǒng)無法與之比擬的。從聲音的質(zhì)量上來說,數(shù)字音頻技術(shù)是為了接近模擬聲音的質(zhì)量徙邻。DSD音頻格式的發(fā)展將更有利的與模擬音頻系統(tǒng)配合排嫌。
二、數(shù)字音頻接口
常見的數(shù)字音頻接口有I2S接口缰犁、PCM接口和SPDIF接口淳地。這里只作簡要介紹。
?I2S接口:只能傳輸單聲道或雙聲道立體聲的數(shù)字音頻帅容,數(shù)據(jù)格式為PCM格式颇象。該接口又派生出三類:左對齊格式、右對齊格式并徘、I2S格式遣钳。I2S時(shí)差性能要優(yōu)于SPDIF,適合短距離通訊麦乞。
PCM接口:也叫DSP模式音頻接口蕴茴。一般用來傳輸單聲道或雙聲道立體聲的數(shù)字音頻,但是理論上也可以傳輸多聲道的數(shù)字音頻姐直。
數(shù)據(jù)格式為PCM格式荐开。
SPDIF接口:SPDIF(SonyPhillips Digital Interface)SONY、PHILIPS數(shù)字音頻接口简肴。它的傳輸載體有同軸和光纖兩種晃听,后者抗干擾能力更強(qiáng)。SPDIF能傳輸PCM流,也能傳輸杜比數(shù)字(DolbyDigital)能扒、DTS這類環(huán)繞聲壓縮音頻信號佣渴。PCM流是原始、未經(jīng)壓縮的音頻信號初斑,杜比數(shù)字辛润、DTS也是來源于PCM流。