使用AVAsset轉(zhuǎn)換音頻格式

關(guān)鍵詞


AVAsset MP3 PCM 格式 音頻 采樣 AVAssetReader AVAssetWriter 輸出 轉(zhuǎn)換

本文所有示例代碼或Demo可以在此獲确矍:https://github.com/WillieWangWei/SampleCode_MP3ToPCM

如果本文對你有所幫助,請給個Star??

概述


本文僅講解所用技術(shù)的基本概念以及將MP3轉(zhuǎn)成PCM格式的實際應(yīng)用谐丢,其他格式的相互轉(zhuǎn)換可以修改示例代碼實現(xiàn)。關(guān)于AVAsset的其他使用場景可以參考這里港令,音頻相關(guān)的內(nèi)容可以參考這里熔号。

首先了解一些概念:

AVAsset

它包含于AVFoundation,是一個不可變的抽象類避除,用來代表一個音視頻媒體。一個AVAsset實例可能包含著一個或多個用來播放或處理的軌道胸嘁,包含但不限于音頻瓶摆、視頻、文本以及相關(guān)說明性宏。但它并不是媒體資源本身群井,可以將它理解為時基媒體的容器。

AVAssetReader

我們可以使用一個AVAssetReader實例從一個AVAsset的實例中獲取媒體數(shù)據(jù)毫胜。

AVAssetReaderAudioMixOutput

它是AVAssetReaderOutput的一個子類书斜,我們可以將一個AVAssetReaderAudioMixOutput的實例綁定到一個AVAssetReader實例上,從而得到這個AVAssetReader實例的asset的音頻采樣數(shù)據(jù)酵使。

AVAssetWriter

我們可以使用一個AVAssetWriter實例將媒體數(shù)據(jù)寫入一個新的文件荐吉,并為其指定類型。

AVAssetWriterInput

我們可以將一個AVAssetWriterInput的實例綁定到一個AVAssetWriter實例上口渔,從而將媒體采樣包裝成CMSampleBuffer對象或者元數(shù)據(jù)集合样屠,然后添加到輸出文件的單一通道上。

PCM

模擬音頻信號經(jīng)模數(shù)轉(zhuǎn)換(A/D變換)直接形成的二進制序列,PCM就是錄制聲音時保存的最原始的聲音數(shù)據(jù)格式痪欲。
WAV格式的音頻其實就是給PCM數(shù)據(jù)流加上一段header數(shù)據(jù)悦穿。而WAV格式有時候之所以被稱為無損格式,就是因為它保存的是原始PCM數(shù)據(jù)(也跟采樣率比特率有關(guān))业踢。常見音頻格式比如MP3栗柒,AAC等等,為了節(jié)約占用空間都進行有損壓縮陨亡。

代碼


這里列舉兩種應(yīng)用場景:

  1. PCM數(shù)據(jù)寫入磁盤保存成文件傍衡。
  2. PCM數(shù)據(jù)轉(zhuǎn)成NSDate保存在內(nèi)存中。

這兩種場景都需要先讀取MP3的數(shù)據(jù)负蠕,然后創(chuàng)建AVAssetReaderAVAssetReaderAudioMixOutput實例,所以前半部分的處理邏輯的一樣的倦畅。

通用邏輯

0.導(dǎo)入頭文件

import AVFoundation

1.創(chuàng)建AVAsset實例

func readMp3File() -> AVAsset? {
    
    guard let filePath = Bundle.main.path(forResource: "trust you", ofType: "mp3") else { return nil }
    let fileURL = URL(fileURLWithPath: filePath)
    let asset = AVAsset(url: fileURL)
    
    return asset
}

2.創(chuàng)建AVAssetReader實例

func initAssetReader(asset: AVAsset) -> AVAssetReader? {
    
    let assetReader: AVAssetReader
    
    do {
        assetReader = try AVAssetReader(asset: asset)
        
    } catch {
        
        print(error)
        return nil
    }
    
    return assetReader
}

3.配置轉(zhuǎn)碼參數(shù)

var channelLayout = AudioChannelLayout()
memset(&channelLayout, 0, MemoryLayout<AudioChannelLayout>.size)
channelLayout.mChannelLayoutTag = kAudioChannelLayoutTag_Stereo

let outputSettings = [
    AVFormatIDKey : kAudioFormatLinearPCM,    // 音頻格式
    AVSampleRateKey : 44100.0,    // 采樣率
    AVNumberOfChannelsKey : 2,    // 通道數(shù) 1 || 2
    AVChannelLayoutKey : Data.init(bytes: &channelLayout, count: MemoryLayout<AudioChannelLayout>.size),  // 聲音效果(立體聲)
    AVLinearPCMBitDepthKey : 16,  // 音頻的每個樣點的位數(shù)
    AVLinearPCMIsNonInterleaved : false,  // 音頻采樣是否非交錯
    AVLinearPCMIsFloatKey : false,    // 采樣信號是否浮點數(shù)
    AVLinearPCMIsBigEndianKey : false // 音頻采用高位優(yōu)先的記錄格式
    ] as [String : Any]

4.創(chuàng)建AVAssetReaderAudioMixOutput實例并綁定到assetReader上

let readerAudioMixOutput = AVAssetReaderAudioMixOutput(audioTracks: asset.tracks, audioSettings: nil)

if !assetReader.canAdd(readerAudioMixOutput) {
    
    print("can't add readerAudioMixOutput")
    return
}

assetReader.add(readerAudioMixOutput)

接來下兩種場景的處理邏輯就不一樣了遮糖,請注意區(qū)分。

保存成文件

5.創(chuàng)建一個AVAssetWriter實例

func initAssetWriter() -> AVAssetWriter? {
    
    let assetWriter: AVAssetWriter
    guard let outPutPath = NSSearchPathForDirectoriesInDomains(.documentDirectory, .userDomainMask, true).first else { return nil }

    // 這里的擴展名'.wav'只是標記了文件的打開方式叠赐,實際的編碼封裝格式由assetWriter的fileType決定
    let fullPath = outPutPath + "outPut.wav"
    let outPutURL = URL(fileURLWithPath: fullPath)
    
    do {
        assetWriter = try AVAssetWriter(outputURL: outPutURL, fileType: AVFileTypeWAVE)
    } catch {
        
        print(error)
        return nil
    }
    
    return assetWriter
}

6.創(chuàng)建AVAssetWriterInput實例并綁定到assetWriter上

if !assetWriter.canApply(outputSettings: outputSettings, forMediaType: AVMediaTypeAudio) {
    
    print("can't apply outputSettings")
    return
}

let writerInput = AVAssetWriterInput(mediaType: AVMediaTypeAudio, outputSettings: outputSettings)

// 是否讓媒體數(shù)據(jù)保持實時欲账。在此不需要開啟
writerInput.expectsMediaDataInRealTime = false

if !assetWriter.canAdd(writerInput) {
    
    print("can't add writerInput")
    return
}

assetWriter.add(writerInput)

7.啟動轉(zhuǎn)碼

assetReader.startReading()
assetWriter.startWriting()

// 開啟session
guard let track = asset.tracks.first else { return }
let startTime = CMTime(seconds: 0, preferredTimescale: track.naturalTimeScale)
assetWriter.startSession(atSourceTime: startTime)

let mediaInputQueue = DispatchQueue(label: "mediaInputQueue")
writerInput.requestMediaDataWhenReady(on: mediaInputQueue, using: {
    
    while writerInput.isReadyForMoreMediaData {
        
        if let nextBuffer = readerAudioMixOutput.copyNextSampleBuffer() {
            writerInput.append(nextBuffer)
            
        } else {
            
            writerInput.markAsFinished()
            assetReader.cancelReading()
            assetWriter.finishWriting(completionHandler: {
                print("write complete")
            })
            break
        }
    }
})
轉(zhuǎn)成NSDate

5.啟動轉(zhuǎn)碼

assetReader.startReading()
var PCMData = Data()

while let nextBuffer = readerAudioMixOutput.copyNextSampleBuffer() {
    
    var audioBufferList = AudioBufferList()
    var blockBuffer: CMBlockBuffer?
    
    // CMSampleBuffer 轉(zhuǎn) Data
    CMSampleBufferGetAudioBufferListWithRetainedBlockBuffer(nextBuffer,
                                                            nil,
                                                            &audioBufferList,
                                                            MemoryLayout<AudioBufferList>.size,
                                                            nil,
                                                            nil,
                                                            0,
                                                            &blockBuffer)
    
    let audioBuffer = audioBufferList.mBuffers
    guard let frame = audioBuffer.mData else { continue }
    
    PCMData.append(frame.assumingMemoryBound(to: UInt8.self), count: Int(audioBuffer.mDataByteSize))
    blockBuffer = nil
}

print("write complete")

注意問題


性能問題

轉(zhuǎn)碼是個很占用CPU資源的計算過程。
具體完成一個轉(zhuǎn)碼過程的時間取決于文件時長芭概、轉(zhuǎn)碼配置赛不、設(shè)備性能等多個條件。這是一個典型的耗時操作罢洲,務(wù)必要做好線程優(yōu)化踢故。另外,可以根據(jù)業(yè)務(wù)邏輯間歇調(diào)用readerAudioMixOutput.copyNextSampleBuffer()及后續(xù)操作惹苗,降低CPU開銷峰值殿较。

內(nèi)存管理

以本文將MP3轉(zhuǎn)成PCM的代碼為例,一個時長4分半左右的MP3對應(yīng)的PCM數(shù)據(jù)在55MB左右桩蓉,這些數(shù)據(jù)占用了大量的內(nèi)存或磁盤空間淋纲,注意釋放。你可以通過改變轉(zhuǎn)碼配置參數(shù)outputSettings來調(diào)整輸出數(shù)據(jù)的大小院究。
在轉(zhuǎn)碼過程中洽瞬,CMSampleBufferRefCMBlockBufferRef的對象在使用后需要調(diào)用CFRelease銷毀业汰,以防內(nèi)存泄漏伙窃。

其他格式的轉(zhuǎn)換

邏輯是一樣的,你可以修改讀取和輸出的參數(shù)實現(xiàn)蔬胯。注意處理的格式必須是AVFoundation所包含的对供,可以參考AudioFormatID這個類以及AVMediaFormat.hFile format UTIs。更多音頻處理請參考Apple Developer Library :AVFoundation或第三方框架。

在macOS上轉(zhuǎn)換格式

macOS上可以使用一個強大的音視頻庫FFmpeg产场,它可以幫助你快速轉(zhuǎn)碼出需要的音頻格式作為調(diào)試素材鹅髓。
macOS上編譯FFmpeg請看這里
MP3轉(zhuǎn)換成PCM的命令:

ffmpeg mp3 => pcm    ffmpeg -i xxx.mp3 -f s16le -ar 44100 -ac 2  xxx.pcm

總結(jié)


本文提供了將MP3轉(zhuǎn)成PCM的一種實現(xiàn)京景,中間涉及了一些音頻窿冯、AVFoundationCoreMedia的知識,這里就不展開了确徙,有問題的同學(xué)可以在文章下留言討論醒串。

本文所有示例代碼或Demo可以在此獲取:https://github.com/WillieWangWei/SampleCode_MP3ToPCM

如果本文對你有所幫助鄙皇,請給個Star??

參考資料:
Apple Developer Library :AVFoundation
http://msching.github.io/blog/2014/07/07/audio-in-ios/

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末芜赌,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子伴逸,更是在濱河造成了極大的恐慌缠沈,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,607評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件错蝴,死亡現(xiàn)場離奇詭異洲愤,居然都是意外死亡,警方通過查閱死者的電腦和手機顷锰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,239評論 3 395
  • 文/潘曉璐 我一進店門柬赐,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人官紫,你說我怎么就攤上這事肛宋。” “怎么了万矾?”我有些...
    開封第一講書人閱讀 164,960評論 0 355
  • 文/不壞的土叔 我叫張陵悼吱,是天一觀的道長。 經(jīng)常有香客問我良狈,道長后添,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,750評論 1 294
  • 正文 為了忘掉前任薪丁,我火速辦了婚禮遇西,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘严嗜。我一直安慰自己粱檀,他們只是感情好,可當我...
    茶點故事閱讀 67,764評論 6 392
  • 文/花漫 我一把揭開白布漫玄。 她就那樣靜靜地躺著茄蚯,像睡著了一般压彭。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上渗常,一...
    開封第一講書人閱讀 51,604評論 1 305
  • 那天壮不,我揣著相機與錄音,去河邊找鬼皱碘。 笑死询一,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的癌椿。 我是一名探鬼主播健蕊,決...
    沈念sama閱讀 40,347評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼踢俄!你這毒婦竟也來了缩功?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,253評論 0 276
  • 序言:老撾萬榮一對情侶失蹤都办,失蹤者是張志新(化名)和其女友劉穎掂之,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體脆丁,經(jīng)...
    沈念sama閱讀 45,702評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,893評論 3 336
  • 正文 我和宋清朗相戀三年动雹,在試婚紗的時候發(fā)現(xiàn)自己被綠了槽卫。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,015評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡胰蝠,死狀恐怖歼培,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情茸塞,我是刑警寧澤躲庄,帶...
    沈念sama閱讀 35,734評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站钾虐,受9級特大地震影響噪窘,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜效扫,卻給世界環(huán)境...
    茶點故事閱讀 41,352評論 3 330
  • 文/蒙蒙 一倔监、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧菌仁,春花似錦浩习、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,934評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春疟赊,著一層夾襖步出監(jiān)牢的瞬間郊供,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,052評論 1 270
  • 我被黑心中介騙來泰國打工听绳, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留颂碘,地道東北人。 一個月前我還...
    沈念sama閱讀 48,216評論 3 371
  • 正文 我出身青樓椅挣,卻偏偏與公主長得像头岔,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子鼠证,可洞房花燭夜當晚...
    茶點故事閱讀 44,969評論 2 355

推薦閱讀更多精彩內(nèi)容