iOS實(shí)時(shí)錄音

Core Audio

Core Audio是iOS和OS X中處理音頻的框架集合，具有高性能，低延遲的優(yōu)點(diǎn)澄阳。Core Audio在iOS中的框架有：Audio Toolbox，Audio Unit，AV Foundation窑多，OpenAL

iOS Core Audio architecture

錄音方案

AVFoundation：提供AVAudioPlayer，AVAudioRecorder類洼滚，以及簡(jiǎn)單的OC接口埂息，錄音過(guò)程是把音頻錄制成音頻文件，播放過(guò)程是播放音頻文件，適合處理非實(shí)時(shí)的場(chǎng)景千康。
Audio Unit：Audio Unit在音頻開(kāi)發(fā)中處于最底層享幽，可以實(shí)時(shí)獲取和播放PCM數(shù)據(jù)，具有響應(yīng)快拾弃，低延遲的優(yōu)點(diǎn)值桩，適用于低延遲實(shí)時(shí)場(chǎng)景。
Audio ToolBox：基于Audio Unit豪椿，提供Core Audio中層和高層服務(wù)的接口奔坟，包括Audio Session Services，AudioQueueService（音頻隊(duì)列）搭盾。音頻隊(duì)列是另一種錄音方案咳秉，將錄制的音頻放置在隊(duì)列中，取出播放鸯隅。
OpenAL：基于Audio Unit澜建，主要提供跨平臺(tái)的接口。
可以看到蝌以，實(shí)時(shí)錄音方案有兩種炕舵，本文主要講述這兩種方式的特點(diǎn)。

Audio Queue

關(guān)于Audio Queue的知識(shí)饼灿，網(wǎng)上有很多比較好的總結(jié)幕侠，如果英文閱讀無(wú)障礙，可以閱讀官方文檔的詳細(xì)說(shuō)明Audio Queue Services Programming Guide碍彭。其錄制和播放示意圖如下：

A recording audio queue

A playback audio queue

大致原理就是晤硕，使用緩存隊(duì)列來(lái)達(dá)到實(shí)時(shí)錄音和播放的效果，以錄音為例庇忌，麥克風(fēng)采集的PCM數(shù)據(jù)首先填充到隊(duì)首的緩存中舞箍，緩存充滿時(shí)就會(huì)出隊(duì)，觸發(fā)回調(diào)函數(shù)皆疹，可以在回調(diào)的時(shí)候做修音處理疏橄，寫入文件，播放等操作略就，然后就清空改緩存捎迫，并將該緩存加入到隊(duì)尾，等待填充表牢，此過(guò)程一直循環(huán)窄绒，播放的過(guò)程同理。
注意：我們可以通過(guò)設(shè)置緩存的大小崔兴，來(lái)控制回調(diào)的時(shí)間彰导，從而實(shí)時(shí)處理音頻蛔翅。其計(jì)算如下：

回調(diào)時(shí)間 ≈ 采樣率 * 采樣位數(shù) / 緩存大小（注意是近似值位谋！)

Audio Queue的錄音方案使用比較簡(jiǎn)單山析，能夠?qū)崟r(shí)處理音頻，但是也有其局限性掏父，它的實(shí)時(shí)性不夠準(zhǔn)確笋轨，有一定的延遲，即回調(diào)函數(shù)的時(shí)間不穩(wěn)定赊淑。當(dāng)采樣率為44100翩腐，位數(shù)為16，緩存大小為8820膏燃，根據(jù)公式回調(diào)時(shí)間約等于100ms，準(zhǔn)確值為92.9ms（稍后解釋）時(shí)何什，回調(diào)時(shí)間如下：

緩存為8820的回調(diào)時(shí)間

可以看到回調(diào)間隔多數(shù)是93ms组哩，也有一些波動(dòng)，第三次到第四次是105ms处渣，而且回調(diào)間隔越小伶贰，波動(dòng)就越大，比如將緩存大小設(shè)置為4410罐栈，回調(diào)時(shí)間如下：

緩存為4410的回調(diào)時(shí)間

這個(gè)時(shí)候波動(dòng)已經(jīng)很明顯了黍衙，第二次到第三次甚至出現(xiàn)了7ms的情況。在實(shí)時(shí)場(chǎng)景中荠诬，每次調(diào)用表示一幀琅翻，在幀大小要求精細(xì)的時(shí)候，這樣的誤差是難以接受的柑贞，需要更穩(wěn)定的錄音方式方椎。

思考：為什么會(huì)出現(xiàn)波動(dòng)的情況？解決方法钧嘶？

這種波動(dòng)的原因是在Audio Queue的底層產(chǎn)生的棠众，之前說(shuō)過(guò)，Audio ToolBox是基于Audio Unit的有决，回調(diào)函數(shù)的波動(dòng)要到底層才能解決闸拿。
[圖片上傳失敗...(image-7780d3-1522826744091)]
可以猜想一下，底層可能有并發(fā)的線程书幕，并發(fā)使得回調(diào)函數(shù)時(shí)間出現(xiàn)隨機(jī)性新荤，就會(huì)產(chǎn)生波動(dòng)，甚至出現(xiàn)例子中7ms調(diào)用兩次的情況按咒。關(guān)于這一點(diǎn)迟隅，可以參考stackoverflow的討論AudioQueueNewInput callback latency中的回答：

The Audio Queue API looks like it is built on top of the Audio Unit RemoteIO API. Small Audio Queue buffers are probably being used to fill a larger RemoteIO buffer behind the scenes. Perhaps even some rate resampling might be taking place (on the original 2G phone).
For lower latency, try using the RemoteIO Audio Unit API directly, and then requesting the audio session to provide your app a smaller lower latency buffer size.

可以看到但骨，使用低延遲的錄音方式，需要使用更底層的Audio Unit智袭。

Audio Unit

關(guān)于Audio Unit的介紹奔缠，官方文檔Audio Unit Hosting Guide for iOS解釋的很詳細(xì)，Audio Unit通常工作在一個(gè)封閉的上下文中吼野，稱之為audio processing graph校哎，如下：

Audio Unit processing

麥克風(fēng)采集到的音頻輸送到audio processing graph中，音頻數(shù)據(jù)經(jīng)過(guò)兩路EQ unit（均衡）瞳步，然后Mixer unit（混合）闷哆，最終到與輸出設(shè)備直接相連的I/O unit。這個(gè)過(guò)程可以看到单起，Audio Unit是對(duì)音頻的直接處理抱怔，甚至可以將unit輸出到外設(shè)，相比于音頻隊(duì)列的配置嘀倒，Audio Unit要更復(fù)雜屈留，下面詳細(xì)介紹使用Audio Unit實(shí)現(xiàn)實(shí)時(shí)錄音的例子。
Audio Unit的構(gòu)建方式分為兩種测蘑，一種是直接使用Unit API灌危，一種是使用Audio Unit Graph，下面采用第一種方式碳胳。

AudioUnit audioUnit;

關(guān)于AudioUnit的解釋：

The type used to represent an instance of a particular audio component

表示的結(jié)構(gòu)如下：
[圖片上傳失敗...(image-ee41ac-1522826744092)]
接下來(lái)就要構(gòu)建Unit的結(jié)構(gòu)勇蝙，在不同的音頻應(yīng)用中，可以構(gòu)建各種不同的結(jié)構(gòu)挨约，一個(gè)簡(jiǎn)單的結(jié)構(gòu)如下：
[圖片上傳失敗...(image-dc3dac-1522826744092)]
確定了結(jié)構(gòu)味混，開(kāi)始配置工作了。

配置AudioSession

和其他錄音播放一樣烫罩，需要配置錄音播放的環(huán)境惜傲，響應(yīng)耳機(jī)事件等。

NSError *error;
AVAudioSession *audioSession = [AVAudioSession sharedInstance];

[audioSession setCategory:AVAudioSessionCategoryPlayAndRecord error:&error];
[audioSession setPreferredSampleRate:44100 error:&error];
[audioSession setPreferredInputNumberOfChannels:1 error:&error];
[audioSession setPreferredIOBufferDuration:0.05 error:&error];

配置AudioComponentDescription

AudioComponentDescription是用來(lái)描述unit 的類型贝攒，包括均衡器盗誊，3D混音，多路混音隘弊，遠(yuǎn)端輸入輸出哈踱，VoIP輸入輸出，通用輸出梨熙，格式轉(zhuǎn)換等开镣，在這里使用遠(yuǎn)端輸入輸出。

AudioComponentDescription audioDesc;
audioDesc.componentType = kAudioUnitType_Output;
audioDesc.componentSubType = kAudioUnitSubType_RemoteIO;
audioDesc.componentManufacturer = kAudioUnitManufacturer_Apple;
audioDesc.componentFlags = 0;
audioDesc.componentFlagsMask = 0;

AudioComponent inputComponent = AudioComponentFindNext(NULL, &audioDesc);
AudioComponentInstanceNew(inputComponent, &audioUnit);

配置輸入輸出的數(shù)據(jù)格式

設(shè)置采樣率為44100咽扇，單聲道邪财，16位的格式陕壹，注意輸入輸出都要設(shè)置。

AudioStreamBasicDescription audioFormat;
audioFormat.mSampleRate = 44100;
audioFormat.mFormatID = kAudioFormatLinearPCM;
audioFormat.mFormatFlags = kAudioFormatFlagIsSignedInteger | kAudioFormatFlagIsPacked;
audioFormat.mFramesPerPacket = 1;
audioFormat.mChannelsPerFrame = 1;
audioFormat.mBitsPerChannel = 16;
audioFormat.mBytesPerPacket = 2;
audioFormat.mBytesPerFrame = 2;

AudioUnitSetProperty(audioUnit,
                     kAudioUnitProperty_StreamFormat,
                     kAudioUnitScope_Output,
                     INPUT_BUS,
                     &audioFormat,
                     sizeof(audioFormat));
AudioUnitSetProperty(audioUnit,
                     kAudioUnitProperty_StreamFormat,
                     kAudioUnitScope_Input,
                     OUTPUT_BUS,
                     &audioFormat,
                     sizeof(audioFormat));

打開(kāi)輸入輸出端口

在默認(rèn)情況下树埠，輸入是關(guān)閉的糠馆，輸出是打開(kāi)的。在unit的Element中怎憋，Input用“1”（和I很像）表示又碌，Output用“0”（和O很像）表示。

UInt32 flag = 1;

AudioUnitSetProperty(audioUnit,
                     kAudioOutputUnitProperty_EnableIO,
                     kAudioUnitScope_Input,
                     INPUT_BUS,
                     &flag,
                     sizeof(flag));
AudioUnitSetProperty(audioUnit,
                     kAudioOutputUnitProperty_EnableIO,
                     kAudioUnitScope_Input,
                     OUTPUT_BUS,
                     &flag,
                     sizeof(flag));

配置回調(diào)

根據(jù)應(yīng)用的場(chǎng)景需求绊袋，可以在輸入輸出設(shè)置回調(diào)毕匀，以輸入回調(diào)為例：

AURenderCallbackStruct recordCallback;
recordCallback.inputProc = RecordCallback;
recordCallback.inputProcRefCon = (__bridge void *)self;
AudioUnitSetProperty(audioUnit,
                     kAudioOutputUnitProperty_SetInputCallback,
                     kAudioUnitScope_Global,
                     INPUT_BUS,
                     &recordCallback,
                     sizeof(recordCallback));

需要定義回調(diào)函數(shù)，回調(diào)函數(shù)是AURenderCallback類型的癌别，按照AUComponent.h中定義的參數(shù)類型皂岔，定義出輸入回調(diào)函數(shù)：

static OSStatus RecordCallback(void *inRefCon,
                           AudioUnitRenderActionFlags *ioActionFlags,
                           const AudioTimeStamp *inTimeStamp,
                           UInt32 inBusNumber,
                           UInt32 inNumberFrames,
                           AudioBufferList *ioData)
{

AudioUnitRender(audioUnit, ioActionFlags, inTimeStamp, inBusNumber, inNumberFrames, buffList);

return noErr;
}

分配緩存

這是獲取錄音數(shù)據(jù)很重要的一步，需要分配緩存來(lái)存儲(chǔ)實(shí)時(shí)的錄音數(shù)據(jù)展姐。如果不這樣做凤薛，錄音數(shù)據(jù)也可以在輸出的時(shí)候獲取，但意義不一樣诞仓，獲取錄音數(shù)據(jù)應(yīng)該在輸入回調(diào)中完成，而不是輸出回調(diào)速兔。

UInt32 flag = 0;
AudioUnitSetProperty(audioUnit,
                     kAudioUnitProperty_ShouldAllocateBuffer,
                     kAudioUnitScope_Output,
                     INPUT_BUS,
                     &flag,
                     sizeof(flag));

buffList = (AudioBufferList*)malloc(sizeof(AudioBufferList));
buffList->mNumberBuffers = 1;
buffList->mBuffers[0].mNumberChannels = 1;
buffList->mBuffers[0].mDataByteSize = 2048 * sizeof(short);
buffList->mBuffers[0].mData = (short *)malloc(sizeof(short) * 2048);

通過(guò)以上設(shè)置墅拭，可以實(shí)時(shí)錄音，并實(shí)時(shí)播放（本例中涣狗，輸入輸出都打開(kāi)了）谍婉。

幾個(gè)問(wèn)題

在真機(jī)上運(yùn)行的時(shí)候，會(huì)報(bào)錯(cuò)镀钓，錯(cuò)誤信息如下：

真機(jī)運(yùn)行錯(cuò)誤信息

這是因?yàn)闆](méi)有開(kāi)啟錄音權(quán)限穗熬，以source code的方式打開(kāi)Info.plist文件，在dict標(biāo)簽中加入以下屬性：

<key>NSMicrophoneUsageDescription</key>
<string>microphoneDesciption</string>

再次運(yùn)行丁溅，就OK了唤蔗。

2.回調(diào)時(shí)間間隔問(wèn)題。
Audio Unit的延遲很低窟赏，回調(diào)時(shí)間非常穩(wěn)定妓柜，很適合嚴(yán)格地實(shí)時(shí)處理音頻，即使把時(shí)間設(shè)置成0.000725623582766秒涯穷，回調(diào)時(shí)間依然很準(zhǔn)：

回調(diào)間隔很短

事實(shí)上棍掐，Audio Unit沒(méi)有回調(diào)間隔的配置，但是我們可以通過(guò)上下文環(huán)境配置拷况，即：

[audioSession setPreferredIOBufferDuration:0.05 error:&error];

這樣設(shè)置duration為0.05秒作煌，表示每隔0.05秒就去讀取緩存數(shù)據(jù)掘殴。假設(shè)采樣率為44100，采樣位數(shù)16粟誓，這時(shí)buffer大小應(yīng)該為44100 * 0.05 * 16 / 8 = 4410奏寨，但是，Audio Unit 的buffer的大小是2的冪次方努酸，那么就不可能有4410服爷，這時(shí)buffer實(shí)際大小為4096，反過(guò)來(lái)計(jì)算時(shí)間就是0.0464秒获诈，這也就解釋了在Audio Queue中近似計(jì)算回調(diào)時(shí)間的原因了仍源。
除此之外，如果不用AudioSession設(shè)置時(shí)間的話舔涎，會(huì)有一個(gè)默認(rèn)大小的buffer笼踩，這個(gè)大小在模擬器和真機(jī)上不相同，所以為了程序可控亡嫌，這個(gè)設(shè)置很有必要嚎于。

3.關(guān)于播放問(wèn)題
測(cè)試發(fā)現(xiàn)，用耳機(jī)的效果更好挟冠，不用耳機(jī)在播放的時(shí)候會(huì)有噪聲于购。如果想獲得清晰的效果，可以將每次的PCM數(shù)據(jù)寫入到文件知染，然后回放肋僧。推薦使用Lame，這個(gè)可以將PCM轉(zhuǎn)換成MP3控淡。

4.讀取PCM數(shù)據(jù)
PCM數(shù)據(jù)存放在AudioBuffer的結(jié)構(gòu)體中嫌吠，音頻數(shù)據(jù)是void *類型的數(shù)據(jù)：

/*!
    @struct         AudioBuffer
    @abstract       A structure to hold a buffer of audio data.
    @field          mNumberChannels
                        The number of interleaved channels in the buffer.
    @field          mDataByteSize
                        The number of bytes in the buffer pointed at by mData.
    @field          mData
                        A pointer to the buffer of audio data.
*/
struct AudioBuffer
{
    UInt32              mNumberChannels;
    UInt32              mDataByteSize;
    void* __nullable    mData;
};
typedef struct AudioBuffer  AudioBuffer;

如果采樣位數(shù)是16位，即2Byte掺炭，即mData中每2Byte是一個(gè)PCM數(shù)據(jù)辫诅，以獲取第一個(gè)數(shù)據(jù)為例：

short *data = (short *)buffList->mBuffers[0].mData;
NSLog(@"%d", data[0]);

這里需要注意的就是類型轉(zhuǎn)換的時(shí)候位數(shù)要一致。

DEMO

Audio Unit實(shí)時(shí)錄音

最后編輯于：2018.09.16 11:22:00

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末涧狮，一起剝皮案震驚了整個(gè)濱河市炕矮，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌者冤，老刑警劉巖吧享，帶你破解...
沈念sama閱讀 216,544評(píng)論 6贊 501
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異譬嚣，居然都是意外死亡钢颂，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,430評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門拜银，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)殊鞭，“玉大人遭垛，你說(shuō)我怎么就攤上這事〔俨樱” “怎么了锯仪？”我有些...
開(kāi)封第一講書(shū)人閱讀 162,764評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)趾盐。經(jīng)常有香客問(wèn)我庶喜，道長(zhǎng)，這世上最難降的妖魔是什么救鲤？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,193評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任久窟，我火速辦了婚禮，結(jié)果婚禮上本缠，老公的妹妹穿的比我還像新娘斥扛。我一直安慰自己，他們只是感情好丹锹，可當(dāng)我...
茶點(diǎn)故事閱讀 67,216評(píng)論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布稀颁。她就那樣靜靜地躺著，像睡著了一般楣黍。火紅的嫁衣襯著肌膚如雪匾灶。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 51,182評(píng)論 1贊 299
城市分裂傳說(shuō)
那天租漂，我揣著相機(jī)與錄音粘昨，去河邊找鬼。笑死窜锯，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的芭析。我是一名探鬼主播锚扎，決...
沈念sama閱讀 40,063評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼馁启！你這毒婦竟也來(lái)了驾孔？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 38,917評(píng)論 0贊 274
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤惯疙，失蹤者是張志新（化名）和其女友劉穎翠勉，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體霉颠，經(jīng)...
沈念sama閱讀 45,329評(píng)論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡对碌，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,543評(píng)論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蒿偎。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片朽们。...
茶點(diǎn)故事閱讀 39,722評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡怀读，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出骑脱，到底是詐尸還是另有隱情菜枷，我是刑警寧澤，帶...
沈念sama閱讀 35,425評(píng)論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布叁丧，位于F島的核電站啤誊，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏拥娄。R本人自食惡果不足惜蚊锹，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,019評(píng)論 3贊 326
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望条舔。院中可真熱鬧枫耳，春花似錦、人聲如沸孟抗。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,671評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)凄硼。三九已至铅协，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間摊沉，已是汗流浹背狐史。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,825評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留说墨，地道東北人骏全。一個(gè)月前我還...
沈念sama閱讀 47,729評(píng)論 2贊 368
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像尼斧，于是被迫代替她去往敵國(guó)和親姜贡。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,614評(píng)論 2贊 353