學(xué)習(xí)整理的相關(guān)章節(jié)鏈接:
基礎(chǔ)篇_1.音視頻學(xué)習(xí)框架
基礎(chǔ)篇_2. 顏色空間模型 RBG浪箭、YUV到腥、HSV
基礎(chǔ)篇_3.圖像編碼之Bmp
基礎(chǔ)篇_4.音頻基礎(chǔ)概念
基礎(chǔ)篇_5.音頻數(shù)據(jù)采集
基礎(chǔ)篇_6.音頻編碼PCM
基礎(chǔ)篇_7.音頻編碼WAV
基礎(chǔ)篇_8.音頻編碼MP3\AAC
1. 為什么會需要做音頻數(shù)據(jù)采集
首先需要理解數(shù)字信號和模擬信號
模擬信號:
模擬信號是指信息參數(shù)在給定范圍內(nèi)表現(xiàn)為連續(xù)的信號。 或在一段連續(xù)的時(shí)間間隔內(nèi)惋鸥,其代表信息的特征量可以在任意瞬間呈現(xiàn)為任意數(shù)值的信號游沿,用簡單的0和1不能夠表達(dá)清晰
數(shù)字信號:
數(shù)字信號是一些離散的信號,數(shù)字信號通常使用1和0表示
都知道計(jì)算機(jī)只認(rèn)識0和1擎淤,所以我們就必須得對模擬信號做轉(zhuǎn)換,轉(zhuǎn)換為數(shù)字信號秸仙。
那么音頻數(shù)據(jù)采集嘴拢,實(shí)際上就是一個將聲波(模擬信號)數(shù)字化的一個過程。
2.數(shù)字音頻采集過程
采樣:
所謂采樣就是在時(shí)間軸上對模擬信號進(jìn)行數(shù)字化寂纪,根據(jù)奈奎斯特定理(采樣定理)席吴,按照比聲音最高頻率2倍以上的頻率進(jìn)行采樣(AD轉(zhuǎn)換)。在基礎(chǔ)篇_4.音頻基礎(chǔ)概念中我們提到人耳聽力范圍是20Hz~20kHz捞蛋,所以采樣頻率一般為40kHz左右孝冒,常用的有44.1kHz(44100次/s采樣)、48kHz等拟杉,采樣率越高庄涡,音質(zhì)越好
量化:
是指在幅度軸上對信號進(jìn)行數(shù)字化。對模擬音頻信號的幅度進(jìn)行數(shù)字化搬设,它決定了模擬信號數(shù)字化以后的動態(tài)范圍穴店,常用的有8位、12位和16位拿穴。量化位越高泣洞,信號的動態(tài)范圍越大,數(shù)字化后的音頻信號就越可能接近原始信號
采樣及量化圖示如下:
編碼:
所謂編碼就是按照一定的格式記錄采樣和量化后的數(shù)字?jǐn)?shù)據(jù)默色,比如順序存儲秽荞、壓縮存儲等等。這里有很多格式熊经,通常所說的音頻的裸數(shù)據(jù)格式就是脈沖編碼調(diào)制(Pulse Code Modulation, PCM)數(shù)據(jù)覆劈。
我們描述一段PCM數(shù)據(jù)通常涉及一下幾個概念:
量化格式(sampleFormat)或者叫深度、采樣率(sampleRate)酗失、聲道數(shù)(Channel)
例如义钉,cd音質(zhì)的相關(guān)參數(shù)為,深度:16bit规肴、采樣率:44100捶闸、聲道數(shù):2
我們在描述聲音格式的大小是夜畴,用到的概念為,數(shù)據(jù)比特率(即1s內(nèi)的比特?cái)?shù)目)删壮,用來衡量音頻數(shù)據(jù)單位時(shí)間內(nèi)的容量大小贪绘,那么cd音質(zhì)的數(shù)據(jù)比特率則為:
44100 * 16 * 2 = 1411.2kbps
一分鐘的cd音質(zhì)數(shù)據(jù)占用的存儲空間大小則為:
(1378.125 * 60) / (8 * 1024 * 1024) = 10.09m
將量化后的二進(jìn)制數(shù)據(jù)存儲下來,就完成了模擬信號到數(shù)字信號的轉(zhuǎn)換央碟。