音視頻學(xué)習(xí)從零到整--(1)
音視頻學(xué)習(xí)從零到整--(2)
音視頻學(xué)習(xí)從零到整--(3)
音視頻學(xué)習(xí)從零到整--(4)
音視頻學(xué)習(xí)從零到整--(5)
音視頻學(xué)習(xí)從零到整--(6)
音視頻學(xué)習(xí)從零到整--(7)
音視頻學(xué)習(xí)從零到整--(9)
音視頻學(xué)習(xí)從零到整--(10)
一.H264壓縮技術(shù).
-
幀內(nèi)預(yù)測(cè)壓縮,解決的是空域數(shù)據(jù)冗余問(wèn)題.
什么是空域數(shù)據(jù),就是這幅圖里數(shù)據(jù)在寬高空間內(nèi)包含了很多顏色,光亮.人的肉眼很難察覺(jué)的數(shù)據(jù). 對(duì)于這些數(shù)據(jù),我們可以認(rèn)作冗余.直接壓縮掉的.
-
幀間預(yù)測(cè)壓縮,解決的是時(shí)域數(shù)據(jù)冗余問(wèn)題.
在我們之前舉例說(shuō)明過(guò),攝像頭在一段時(shí)間內(nèi)所捕捉的數(shù)據(jù)沒(méi)有較大的變化,我們針對(duì)這一時(shí)間內(nèi)的相同的數(shù)據(jù)壓縮掉.這叫時(shí)域數(shù)據(jù)壓縮.
-
整數(shù)離散余弦變換(DCT),將空間上的相關(guān)性變?yōu)轭l域上無(wú)關(guān)的數(shù)據(jù)然后進(jìn)行量化.
這個(gè)比較抽象.這個(gè)跟數(shù)學(xué)是緊密聯(lián)系在一起的.如果對(duì)傅里葉變換理解的比較好的.對(duì)這個(gè)會(huì)理解的比較快.如果對(duì)傅里葉變換不了解的.可能有稍許困難.傅里葉變換可以把一個(gè)復(fù)雜波形圖變換成許多的正弦波.只是他們之間的頻率不一樣.以及振幅也不一樣.如果它們?cè)陬l率上沒(méi)有一致性那么我們就可以對(duì)他進(jìn)行壓縮處理.
CABAC壓縮:無(wú)損壓縮.
二.宏塊劃分與分組.
H264宏塊劃分.可以參考下圖.
將一個(gè)圖片左上角用宏塊描述,就是宏塊是8*8的元素.取出的顏色,像右邊的去描述.描述顏色.將一個(gè)圖片全部用宏塊描述就如下圖.
基本的圖片的宏塊劃分就完成了.那是不是每個(gè)宏塊都是8*8了?并不是的.還有子塊劃分.
子塊劃分:
在這個(gè)大的宏塊里,可以再細(xì)化. 我們可以看到在這個(gè)大的宏塊里,我們更加細(xì)化了. 比如我們中間這個(gè)全部都是藍(lán)色的這個(gè)宏塊,就可以用一個(gè)色塊,更加簡(jiǎn)單描述就行了.
我們對(duì)比旁邊的MPEG2和H.264.就會(huì)發(fā)現(xiàn)MPEG2存儲(chǔ)時(shí)還說(shuō)比較完整.占用的空間相對(duì)于比較多.而H.264還是減少了很多空間.像重復(fù)的顏色他們就用非常簡(jiǎn)單的色塊描述了.
幀分組:
例如,一個(gè)臺(tái)球從一個(gè)位置移動(dòng)到另外一個(gè)組. 可以發(fā)現(xiàn)它的桌面背景是一樣的.只是球體位置發(fā)生了變換.這個(gè)我們就可以把這一組幀劃分為一組.
三. 組內(nèi)宏塊查找
什么是組內(nèi)宏塊查找?
實(shí)際就如下圖.臺(tái)球從一角滾到另外一角.相鄰的2幅圖做組內(nèi)的宏塊查找.
將圖逐行掃描,掃描到第三行.發(fā)現(xiàn)了臺(tái)球. 然后圍繞它的周?chē)檎?發(fā)現(xiàn)了有類(lèi)似的圖塊.
運(yùn)動(dòng)估算:
然后就把他們放在同一張圖中.也就是說(shuō)臺(tái)球剛開(kāi)始從位置1.到第二張圖移動(dòng)到位置2.這之間有一個(gè)運(yùn)動(dòng)矢量.矢量會(huì)包含運(yùn)動(dòng)的方向和距離.將所有的圖都兩兩比較.最后就形成了右邊這張圖.就是右圖中紅色部分.每一個(gè)紅色的箭頭標(biāo)注都是一個(gè)運(yùn)動(dòng)矢量.很多幀就會(huì)形成一個(gè)連續(xù)的運(yùn)動(dòng)估算.那么這個(gè)估算之后,我們要達(dá)到什么結(jié)果了?
運(yùn)動(dòng)矢量與補(bǔ)償壓縮:
最終將連續(xù)的運(yùn)動(dòng)估算 換算成下圖所表現(xiàn)的.我們就是對(duì)齊進(jìn)行壓縮.所有幀的背景都是一樣的.變換在哪里了?變換就是它的運(yùn)動(dòng)矢量還有臺(tái)球的數(shù)據(jù). 實(shí)際經(jīng)過(guò)我們一運(yùn)算后.它留下的就只是運(yùn)動(dòng)矢量數(shù)據(jù)+殘差值的數(shù)據(jù). 經(jīng)過(guò)這樣的一個(gè)計(jì)算.幀間壓縮數(shù)據(jù)我們就可以看到實(shí)際我們只需要存儲(chǔ)一點(diǎn)點(diǎn)數(shù)據(jù).而不像以前要將幾十幀的所有圖片數(shù)據(jù)保存下來(lái).這就達(dá)到了壓縮的效果. 這個(gè)過(guò)程就叫做幀間壓縮技術(shù)的原理.
四. 幀內(nèi)預(yù)測(cè)
幀內(nèi)壓縮是針對(duì)于I幀的.因?yàn)樗鉀Q的是空間的數(shù)據(jù)冗余.而幀間壓縮是解決的時(shí)間數(shù)據(jù)冗余.我們剛剛說(shuō)明的是幀間壓縮技術(shù).將大量在時(shí)間軌跡上相同的數(shù)據(jù)壓縮掉.只留下運(yùn)算估量和殘差值.
而幀內(nèi)我們采用了其他的壓縮原理
如下圖,首先要經(jīng)過(guò)計(jì)算,選擇用那種模式.對(duì)每一個(gè)宏塊采用不同的模式運(yùn)算.
當(dāng)每個(gè)宏塊都選定了模式之后.就形成了下圖的這樣的效果.每個(gè)宏塊都選擇一個(gè)幀內(nèi)預(yù)測(cè)的模式.幀內(nèi)預(yù)測(cè)一共有9種模式.
幀內(nèi)預(yù)測(cè)9種模式原理介紹(1)
幀內(nèi)預(yù)測(cè)9種模式原理介紹(2)
讓每個(gè)宏塊挑選好模式之后,我們就可以使用塊預(yù)測(cè)模式.預(yù)測(cè)完了之后,它就得到一個(gè)張"預(yù)測(cè)圖".
左邊是預(yù)測(cè)圖,右邊是源圖.
計(jì)算的預(yù)測(cè)圖和原圖是有差別的. 原圖比較圓潤(rùn).預(yù)測(cè)圖相對(duì)而言比較粗糙. 現(xiàn)在有兩幅圖.這時(shí)就做2張圖的差計(jì)算.
計(jì)算幀內(nèi)預(yù)測(cè)殘差值:
底下的圖就是我們的原圖.通過(guò)預(yù)測(cè)與原圖的差得出一個(gè)結(jié)果.這個(gè)灰色圖就是殘差值.
預(yù)測(cè)模式與殘差值壓縮:
拿到參差值之后,我們就進(jìn)行壓縮. 壓縮時(shí)保存,殘差數(shù)據(jù)和每個(gè)宏塊選擇的模式信息數(shù)據(jù). 那么有了這2個(gè)數(shù)據(jù)之后.當(dāng)我們解碼時(shí),首先通過(guò)宏塊的模式信息計(jì)算出預(yù)測(cè)圖.然后將預(yù)測(cè)圖與我們的殘差值進(jìn)行累積.就能還原成原圖像. 那這個(gè)過(guò)程就是"幀內(nèi)壓縮技術(shù)"的原理過(guò)程.
五.DCT壓縮
DCT壓縮也是整數(shù)余弦壓縮技術(shù). 那它是如何壓縮?
我們劃分一個(gè)可量化的宏塊.
然后將量化的宏塊根據(jù)DCT數(shù)學(xué)方法.進(jìn)行壓縮.
壓縮后的就成這個(gè)樣子.
左上角有數(shù)據(jù)分布,右下角數(shù)據(jù)為空.從而達(dá)到數(shù)據(jù)量減少的作用.那它是如果做到的了? 這個(gè)如果計(jì)算是需要非常深的數(shù)學(xué)功底.如果感興趣的可以在網(wǎng)絡(luò)上搜索一下.
六.VLC壓縮
VLC 用類(lèi)似哈夫曼碼. 用短碼來(lái)記錄高頻數(shù)據(jù).用長(zhǎng)碼記錄低頻數(shù)據(jù).
頻率高的就編為短碼,頻率低的就編為長(zhǎng)碼.
經(jīng)過(guò)VLC壓縮之后,就變成了無(wú)損壓縮的方式了.
CABAC壓縮(上下文適應(yīng)無(wú)損壓縮技術(shù))
VLC實(shí)際上是MPEG2使用的技術(shù).而H264使用的是CABAC.也就是上下文適應(yīng)技術(shù).除了使用哈夫曼短碼高頻,長(zhǎng)碼高頻的方式還加上了上下文適應(yīng)的技術(shù).根據(jù)上下文就可以加大壓縮比.
對(duì)比:
VLC壓縮的數(shù)據(jù)都是大塊.無(wú)損壓縮.
而CABAC壓縮,會(huì)隨著壓縮的數(shù)據(jù)增大,上下文信息全面.壓縮比隨之增大.數(shù)據(jù)塊從大塊降低成小數(shù)據(jù)塊.
文章圖片來(lái)源于網(wǎng)絡(luò),如未能核實(shí)來(lái)源或轉(zhuǎn)發(fā)內(nèi)容圖片有瑕疵,請(qǐng)及時(shí)私信本人進(jìn)行修改或者刪除.
- 參考 #音視頻開(kāi)發(fā)進(jìn)階指南#
- 圖片參考于: http://www.reibang.com/p/97b4dc8c7f00
推薦文集
* 抖音效果實(shí)現(xiàn)
* BAT—最新iOS面試題總結(jié)
* iOS面試題合集
原文作者:集才華美貌于一身的—C姐