從事音樂相關(guān)的app開發(fā)也已經(jīng)有一段時(shí)日了缔俄,在這過程中app的播放器幾經(jīng)修改我也因此對于iOS下的音頻播放實(shí)現(xiàn)有了一定的研究。寫這個(gè)系列的博客目的一方面希望能夠拋磚引玉,另一方面也是希望能幫助國內(nèi)其他的iOS開發(fā)者和愛好者少走彎路俐载。
本篇為《iOS音頻播放》系列的第一篇铐懊,主要將對iOS下實(shí)現(xiàn)音頻播放的方法進(jìn)行概述。原文|地址
基礎(chǔ)
先來簡單了解一下一些基礎(chǔ)的音頻知識瞎疼。
目前我們在計(jì)算機(jī)上進(jìn)行音頻播放都需要依賴于音頻文件科乎,音頻文件的生成過程是將聲音信息采樣、量化和編碼產(chǎn)生的數(shù)字信號的過程贼急,人耳所能聽到的聲音茅茂,最低的頻率是從20Hz起一直到最高頻率20KHZ,因此音頻文件格式的最大帶寬是20KHZ太抓。根據(jù)奈奎斯特的理論空闲,只有采樣頻率高于聲音信號最高頻率的兩倍時(shí),才能把數(shù)字信號表示的聲音還原成為原來的聲音走敌,所以音頻文件的采樣率一般在40~50KHZ碴倾,比如最常見的CD音質(zhì)采樣率44.1KHZ。
對聲音進(jìn)行采樣掉丽、量化過程被稱為脈沖編碼調(diào)制(Pulse Code Modulation)跌榔,簡稱PCM
。PCM數(shù)據(jù)是最原始的音頻數(shù)據(jù)完全無損捶障,所以PCM數(shù)據(jù)雖然音質(zhì)優(yōu)秀但體積龐大僧须,為了解決這個(gè)問題先后誕生了一系列的音頻格式,這些音頻格式運(yùn)用不同的方法對音頻數(shù)據(jù)進(jìn)行壓縮项炼,其中有無損壓縮(ALAC担平、APE、FLAC)和有損壓縮(MP3锭部、AAC暂论、OGG、WMA)兩種拌禾。
目前最為常用的音頻格式是MP3取胎,MP3是一種有損壓縮的音頻格式,設(shè)計(jì)這種格式的目的就是為了大幅度的減小音頻的數(shù)據(jù)量蹋砚,它舍棄PCM音頻數(shù)據(jù)中人類聽覺不敏感的部分扼菠,從下面的比較圖我們可以明顯的看到MP3數(shù)據(jù)相比PCM數(shù)據(jù)明顯矮了一截(圖片引自imp3論壇)摄杂。
MP3格式中的碼率(BitRate)代表了MP3數(shù)據(jù)的壓縮質(zhì)量坝咐,現(xiàn)在常用的碼率有128kbit/s、160kbit/s析恢、320kbit/s等等墨坚,這個(gè)值越高聲音質(zhì)量也就越高。MP3編碼方式常用的有兩種固定碼率(Constant bitrate,CBR)和可變碼率(Variable bitrate泽篮,VBR)盗尸。
MP3格式中的數(shù)據(jù)通常由兩部分組成,一部分為ID3用來存儲歌名帽撑、演唱者泼各、專輯、音軌數(shù)等信息亏拉,另一部分為音頻數(shù)據(jù)扣蜻。音頻數(shù)據(jù)部分以幀(frame)為單位存儲,每個(gè)音頻都有自己的幀頭及塘,如圖所示就是一個(gè)MP3文件幀結(jié)構(gòu)圖(圖片同樣來自互聯(lián)網(wǎng))莽使。MP3中的每一個(gè)幀都有自己的幀頭,其中存儲了采樣率等解碼必須的信息笙僚,所以每一個(gè)幀都可以獨(dú)立于文件存在和播放芳肌,這個(gè)特性加上高壓縮比使得MP3文件成為了音頻流播放的主流格式。幀頭之后存儲著音頻數(shù)據(jù)肋层,這些音頻數(shù)據(jù)是若干個(gè)PCM數(shù)據(jù)幀經(jīng)過壓縮算法壓縮得到的亿笤,對CBR的MP3數(shù)據(jù)來說每個(gè)幀中包含的PCM數(shù)據(jù)幀是固定的,而VBR是可變的栋猖。
iOS音頻播放概述
了解了基礎(chǔ)概念之后我們就可以列出一個(gè)經(jīng)典的音頻播放流程(以MP3為例):
- 讀取MP3文件
- 解析采樣率责嚷、碼率、時(shí)長等信息掂铐,分離MP3中的音頻幀
- 對分離出來的音頻幀解碼得到PCM數(shù)據(jù)
- 對PCM數(shù)據(jù)進(jìn)行音效處理(均衡器罕拂、混響器等,非必須)
- 把PCM數(shù)據(jù)解碼成音頻信號
- 把音頻信號交給硬件播放
- 重復(fù)1-6步直到播放完成
在iOS系統(tǒng)中apple對上述的流程進(jìn)行了封裝并提供了不同層次的接口(圖片引自官方文檔)全陨。
下面對其中的中高層接口進(jìn)行功能說明:
- Audio File Services:讀寫音頻數(shù)據(jù)爆班,可以完成播放流程中的第2步;
- Audio File Stream Services:對音頻進(jìn)行解碼辱姨,可以完成播放流程中的第2步柿菩;
- Audio Converter services:音頻數(shù)據(jù)轉(zhuǎn)換,可以完成播放流程中的第3步雨涛;
- Audio Processing Graph Services:音效處理模塊枢舶,可以完成播放流程中的第4步;
- Audio Unit Services:播放音頻數(shù)據(jù):可以完成播放流程中的第5步替久、第6步凉泄;
- Extended Audio File Services:Audio File Services和Audio Converter services的結(jié)合體;
- AVAudioPlayer/AVPlayer(AVFoundation):高級接口蚯根,可以完成整個(gè)音頻播放的過程(包括本地文件和網(wǎng)絡(luò)流播放后众,第4步除外);
- Audio Queue Services:高級接口,可以進(jìn)行錄音和播放蒂誉,可以完成播放流程中的第3教藻、5、6步右锨;
- OpenAL:用于游戲音頻播放括堤,暫不討論
可以看到apple提供的接口類型非常豐富,可以滿足各種類別類需求:
如果你只是想實(shí)現(xiàn)音頻的播放绍移,沒有其他需求AVFoundation會很好的滿足你的需求痊臭。它的接口使用簡單、不用關(guān)心其中的細(xì)節(jié)登夫;
如果你的app需要對音頻進(jìn)行流播放并且同時(shí)存儲广匙,那么AudioFileStreamer加AudioQueue能夠幫到你,你可以先把音頻數(shù)據(jù)下載到本地恼策,一邊下載一邊用NSFileHandler等接口讀取本地音頻文件并交給AudioFileStreamer或者AudioFile解析分離音頻幀鸦致,分離出來的音頻幀可以送給AudioQueue進(jìn)行解碼和播放。如果是本地文件直接讀取文件解析即可涣楷。(這兩個(gè)都是比較直接的做法分唾,這類需求也可以用AVFoundation+本地server的方式實(shí)現(xiàn),AVAudioPlayer會把請求發(fā)送給本地server狮斗,由本地server轉(zhuǎn)發(fā)出去绽乔,獲取數(shù)據(jù)后在本地server中存儲并轉(zhuǎn)送給AVAudioPlayer。另一個(gè)比較trick的做法是先把音頻下載到文件中碳褒,在下載到一定量的數(shù)據(jù)后把文件路徑給AVAudioPlayer播放折砸,當(dāng)然這種做法在音頻seek后就回有問題了。)沙峻;
-
如果你正在開發(fā)一個(gè)專業(yè)的音樂播放軟件睦授,需要對音頻施加音效(均衡器、混響器)摔寨,那么除了數(shù)據(jù)的讀取和解析以外還需要用到AudioConverter來把音頻數(shù)據(jù)轉(zhuǎn)換成PCM數(shù)據(jù)去枷,再由AudioUnit+AUGraph來進(jìn)行音效處理和播放(但目前多數(shù)帶音效的app都是自己開發(fā)音效模塊來坐PCM數(shù)據(jù)的處理,這部分功能自行開發(fā)在自定義性和擴(kuò)展性上會比較強(qiáng)一些是复。PCM數(shù)據(jù)通過音效器處理完成后就可以使用AudioUnit播放了删顶,當(dāng)然AudioQueue也支持直接使對PCM數(shù)據(jù)進(jìn)行播放。)淑廊。下圖描述的就是使用AudioFile + AudioConverter + AudioUnit進(jìn)行音頻播放的流程(圖片引自官方文檔)逗余。
image.png