聲音
如何將現(xiàn)實生活中的聲音轉(zhuǎn)換成數(shù)字信號?
脈沖編碼調(diào)制(PCM)
脈沖編碼調(diào)制示意圖
- 圖3-2(a)乌逐,是一個以Ts為時間間隔的窄脈沖序列p(t)玛荞。因為要用它進行抽樣秉沼,所以稱為#抽樣脈沖梭冠。
- 圖3-2(b)辕狰,v(t)是待抽樣的模擬電壓信號,抽樣后的離散信號k(t)的取值分別為k(0)=0.2控漠,k(Ts)=0.4蔓倍,k(2Ts)=1.8,k(3Ts)=2.8盐捷,k(4Ts)=3.6偶翅,k(5Ts)=5.1,k(6Ts)=6.0碉渡,k(7Ts)=5.7聚谁,k(8Ts)=3.9,k(9Ts)=2.0滞诺,k(10Ts)=1.2垦巴,可見取值在0-6之間是隨機的,也就是說可以有無窮個可能的取值铭段。
- 圖3-2(c)骤宣,為了把無窮個可能取值變成有限個,我們必須對k(t)的取值進行量化(即四舍五入)序愚,得到m(t)則m(t)的取值變?yōu)?m(0)=0.0憔披,m(Ts)=0.0,m(2Ts)=2.0爸吮,m(3Ts)=3.0芬膝,m(4Ts)=4.0,m(5Ts)=5.0形娇,m(6Ts)=6.0锰霜,m(7Ts)=6.0,m(8Ts)=4.0桐早,m(9Ts)=2.0癣缅,m(10Ts)=1.0,總共只有0-6等7個可能的取值哄酝。
-
圖3-2(d)友存,m(t)已經(jīng)變成數(shù)字信號,但還不是實際應用中的二進制數(shù)字信號陶衅,因此對m(t)用3位二進制編碼元進行自然編碼就得到圖3-2(d)的數(shù)字信號d(t)屡立,從而完成了A/D轉(zhuǎn)換,實現(xiàn)了脈沖編碼調(diào)制搀军,即PCM全過程膨俐。
模擬電壓信號V(t)通過乘法器與一個抽樣窄脈沖序列p(t)相乘勇皇,就會得到一個幅度值隨V(t)的變化而變化的窄脈沖序列k(t)
了解量化過程
量化就是將一個連續(xù)函數(shù)的無限個數(shù)值的集合映射為一個離散函數(shù)的有限個數(shù)值的集合。
- 量化值—— 確定的量化后的取值
- 量化級—— 量化值的個數(shù)
- 量化間隔—— 相鄰的2個量化值之差
v(t)的樣值信號k(t)和量化后的量化信號m(t)是不一樣的焚刺。
例如:k(0) = 0.2 而 m(0) = 0
接收端只能是量化后的信號m(t)敛摘,而不能恢復出k(t),這樣就使得收發(fā)信號之間的誤差,這稱為量化誤差或量化噪聲檩坚。
采用的是"四舍五入"進行量化,因此量化噪聲的最大值是0.5诅福,一般來說匾委,量化噪聲,最大絕對誤差值是0.5個量化間隔氓润。這個量化間隔都一樣的量化叫做均勻量化赂乐。
音頻壓縮編碼原理&標準
數(shù)字音頻的質(zhì)量取決于:采樣頻率和量化位數(shù)這2個參數(shù)為了保證在時間變化方向上取樣點盡量密,取樣頻率要高咖气,在幅度取值上盡量細挨措,量化比特率要高,直接的結(jié)果就是存儲容量及傳輸信道容量要求的壓力崩溪。
-
音頻信號的傳輸率 = 取樣頻率 * 樣本量化比特數(shù) * 通道數(shù)
取樣頻率 = 44.1kHz 樣本值的量化比特率 = 16 普通立體聲的信號通道數(shù)= 2 數(shù)字信號傳輸碼流大約 1.4Mbit(8/Byte) 達176.4Byte(字節(jié)),等于88200個漢字的數(shù)據(jù)量
數(shù)字音頻信號包含的對人們感受信息影響可以忽略的成分成為冗余
— 時域冗余
— 頻域冗余
— 聽覺冗余
MPEG-1 音頻壓縮編碼標準 高保真壓縮
杜比AC-3 音頻壓縮編碼
MPEG-2 AAC 壓縮到20:1都不損音質(zhì)浅役,支持多聲道48個,更高的解析度96hz伶唯,提升編碼效率觉既,解碼占用內(nèi)存少 高效的處理方式
MPEG-4 音頻壓縮編碼
AAC解碼算法原理詳解
本文詳細介紹了符合ISO/IEC 13818-7(MPEG2 AAC audio codec) , ISO/IEC 14496-3(MPEG4 Audio Codec AAC Low Complexity)進行壓縮的的AAC音頻的解碼算法。
AAC音頻格式有ADIF(適用于磁盤) & ADTS
將PCM轉(zhuǎn)換為AAC音頻流
1.設置編碼器(codec)乳幸,并開始錄制
2.收集PCM數(shù)據(jù)瞪讼,傳給編碼器
3.編碼完成后回調(diào)callback,寫入文件
1粹断、程序系統(tǒng)結(jié)構(gòu)
下面是AAC解碼流程圖:
在主控模塊開始運行后符欠,主控模塊將AAC比特流的一部分放入輸入緩沖區(qū),通 過查找同步字得到一幀的起始瓶埋,找到后希柿,根據(jù)ISO/IEC 13818- 7所述的語法開始進行Noisless Decoding(無噪解碼),無噪解碼實際上就是哈夫曼解碼养筒,通過反量化(Dequanti ze)狡汉、聯(lián)合立體聲(Joint Stereo),知覺噪聲替換(PNS),瞬時噪聲整形(TNS)闽颇,反離散余弦變換(IM DCT)盾戴,頻段復制(SBR)這幾個模塊之后,得出左右聲道的PCM碼流兵多,再由主控 模塊將其放入輸出緩沖區(qū)輸出到聲音播放設備尖啡。
2. 主控模塊
主控模塊的主要任務是操作輸入輸出緩沖區(qū)橄仆,調(diào)用其它各模塊協(xié)同工作。其中 衅斩,輸入輸出緩沖區(qū)均由DSP控制模塊提供接口盆顾。輸出緩沖區(qū)中將存放的數(shù)據(jù)為解 碼出來的PCM數(shù)據(jù),代表了聲音的振幅畏梆。它由一塊固定長度的緩沖區(qū)構(gòu)成您宪,通過 調(diào)用DSP控制模塊的接口函數(shù),得到頭指針奠涌,在完成輸出緩沖區(qū)的填充后宪巨,調(diào)用 中斷處理輸出至I2S接口所連接的音頻ADC芯片(立體聲音頻DAC和DirectDrive 耳機放大器)輸出模擬聲音。
3. 同步及元素解碼
同步及元素解碼模塊主要用于找出格式信息溜畅,并進行頭信息解碼捏卓,以及對元素
信息進行解碼。這些解碼的結(jié)果用于后續(xù)的無噪解碼和尺度因子解碼模塊慈格。
AAC的音頻文件格式有以下兩種:
ADIF:Audio Data Interchange Format 音頻數(shù)據(jù)交換格式怠晴。這種格式的特征是可以確定的找到這個音頻數(shù)據(jù)的開始, 不需進行在音頻數(shù)據(jù)流中間開始的解碼浴捆,即它的解碼必須在明確定義的開始處 進行蒜田。故這種格式常用在磁盤文件中。
ADTS:Audio Data Transport Stream 音頻數(shù)據(jù)傳輸流选泻。這種格式的特征是它是一個有同步字的比特流物邑,解碼可以在 這個流中任何位置開始。它的特征類似于mp3數(shù)據(jù)流格式滔金。
AAC的ADIF格式見下圖: