目前音頻收集的流程
image.png
1 模擬信號(hào) -> 數(shù)字信號(hào) (ADC Analog to Digital Conversion)
image.png
每個(gè)點(diǎn)的數(shù)據(jù)都轉(zhuǎn)換為 電子信號(hào) (Binary 2~16bits)
image.png
2 采樣(Sample) 范圍
一般是 44100HZ
每兩個(gè)采樣點(diǎn) 間隔 大概是 1000ms / 44100Hz ~ 23us(微秒)-
為什么現(xiàn)在的設(shè)備不能無限放大拗胜,理論上可以1us 一個(gè)采樣
- 那是因?yàn)?這會(huì)導(dǎo)致文件非常大
- 同時(shí) 人耳對(duì)音頻信號(hào)的平均感知能力為 50us長度揖庄,或者最高20000hz精度
為什么是44100HZ 而不是 46000HZ
因?yàn)樵缙诘腃D最大容納采樣為44100HZ為什么不是20000hz 正好適配人耳
因?yàn)?奈奎斯特抽樣定理
:
要從抽樣信號(hào)中無失真地恢復(fù)原信號(hào)里逆,抽樣頻率應(yīng)大于2倍信號(hào)最高頻率颂碧。
奈奎斯特抽樣定理 :要從抽樣信號(hào)中無失真地恢復(fù)原信號(hào)绑莺,抽樣頻率應(yīng)大于2倍信號(hào)最高頻率
。 抽樣頻率小于2倍頻譜最高頻率時(shí)戴尸,信號(hào)的頻譜有混疊
熬甚。 抽樣頻率大于2倍頻譜最高頻率時(shí),信號(hào)的頻譜無混疊聊品。
3 采樣深度精度
例如 ADC過程 將Analog轉(zhuǎn)換為Digital信號(hào) 可以取不同的范圍區(qū)間飞蹂,例如00-01 或者 00-11
image.png
但是如何才可以準(zhǔn)確 保留信號(hào) 并且還原的區(qū)間
image.png
- 比特深度 以CD為例,按照16bits
image.png
- 這個(gè)過程 ADC 稱為
量化
image.png
- 將bits分配給每個(gè)值 稱為
脈沖編碼調(diào)制(Pulse code modulation)
image.png
- 但是更高質(zhì)量音頻信號(hào)翻屈,比特深度范圍更大 例如 24~36bits
其實(shí)和 視頻HDR 10bits和 SDR 8bits差不多
image.png
4 壓縮
未壓縮的 60s的 LR雙省道 16bits 44100hz 大概是10.5MB
原始數(shù)據(jù) 10.5MB/min
MP3 -> 2.4MB/min (有損壓縮 Lossy)
(和視頻幀內(nèi)壓縮同理 去掉人耳不擅長聽出來的 高頻數(shù)據(jù))
(例如去掉音量特別小的數(shù)據(jù)陈哑、音調(diào)特別高的)-
Lossless無壓縮編碼
- Flac
- Alac
主要通過重復(fù)數(shù)據(jù)壓縮編碼(熵編碼、殘差編碼)