第1章介紹
1. 為什么要進(jìn)行視頻壓縮吼蚁?
未經(jīng)壓縮的數(shù)字視頻的數(shù)據(jù)量巨大
存儲(chǔ)困難
一張DVD只能存儲(chǔ)幾秒鐘的未壓縮數(shù)字視頻旗国。
傳輸困難
1兆的帶寬傳輸一秒的數(shù)字電視視頻需要大約4分鐘度硝。
2.為什么可以壓縮
去除冗余信息
空間冗余:圖像相鄰像素之間有較強(qiáng)的相關(guān)性
時(shí)間冗余:視頻序列的相鄰圖像之間內(nèi)容相似
編碼冗余:不同像素值出現(xiàn)的概率不同
視覺(jué)冗余:人的視覺(jué)系統(tǒng)對(duì)某些細(xì)節(jié)不敏感
知識(shí)冗余:規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到
3.數(shù)據(jù)壓縮分類
無(wú)損壓縮(Lossless)
壓縮前解壓縮后圖像完全一致X=X'
壓縮比低(2:1~3:1)
例如:Winzip,JPEG-LS
有損壓縮(Lossy)
壓縮前解壓縮后圖像不一致X≠X'
壓縮比高(10:1~20:1)
利用人的視覺(jué)系統(tǒng)的特性
例如:MPEG-2寿冕,H.264/AVC蕊程,AVS
4.編解碼器
編碼器(Encoder)
壓縮信號(hào)的設(shè)備或程序
解碼器(Decoder)
解壓縮信號(hào)的設(shè)備或程序
編解碼器(Codec)
編解碼器對(duì)
5. 壓縮系統(tǒng)的組成
(1) 編碼器中的關(guān)鍵技術(shù)
(2) 編解碼中的關(guān)鍵技術(shù)
6.編解碼器實(shí)現(xiàn)
編解碼器的實(shí)現(xiàn)平臺(tái):
超大規(guī)模集成電路VLSI
ASIC, FPGA
數(shù)字信號(hào)處理器DSP
軟件
編解碼器產(chǎn)品:
機(jī)頂盒
數(shù)字電視
攝像機(jī)
監(jiān)控器
7. 視頻編碼標(biāo)準(zhǔn)
編碼標(biāo)準(zhǔn)作用:
兼容:
不同廠家生產(chǎn)的編碼器壓縮的碼流能夠被不同廠家的解碼器解碼
高效:
標(biāo)準(zhǔn)編解碼器可以進(jìn)行批量生產(chǎn)驼唱,節(jié)約成本藻茂。
主流的視頻編碼標(biāo)準(zhǔn):
MPEG-2
MPEG-4 Simple Profile
H.264/AVC
AVS
VC-1
標(biāo)準(zhǔn)化組織:
ITU:International Telecommunications Union
VECG:Video Coding Experts Group
ISO:International Standards Organization
MPEG:Motion Picture Experts Group
8. 視頻傳輸
視頻傳輸:通過(guò)傳輸系統(tǒng)將壓縮的視頻碼流從編碼端傳輸?shù)浇獯a端
傳輸系統(tǒng):互聯(lián)網(wǎng),地面無(wú)線廣播玫恳,衛(wèi)星
9. 視頻傳輸面臨的問(wèn)題
傳輸系統(tǒng)不可靠
帶寬限制
信號(hào)衰減
噪聲干擾
傳輸延遲
視頻傳輸出現(xiàn)的問(wèn)題
不能解碼出正確的視頻
視頻播放延遲
10. 視頻傳輸差錯(cuò)控制
差錯(cuò)控制(Error Control)解決視頻傳輸過(guò)程中由于數(shù)據(jù)丟失或延遲導(dǎo)致的問(wèn)題
差錯(cuò)控制技術(shù):
信道編碼差錯(cuò)控制技術(shù)
編碼器差錯(cuò)恢復(fù)
解碼器差錯(cuò)隱藏
11.視頻傳輸?shù)腝oS參數(shù)
數(shù)據(jù)包的端到端的延遲
帶寬:比特/秒
數(shù)據(jù)包的流失率
數(shù)據(jù)包的延遲時(shí)間的波動(dòng)
第2章 數(shù)字視頻
1.圖像與視頻
圖像:是人對(duì)視覺(jué)感知的物質(zhì)再現(xiàn)辨赐。
三維自然場(chǎng)景的對(duì)象包括:深度,紋理和亮度信息
二維圖像:紋理和亮度信息
視頻:連續(xù)的圖像京办。
視頻由多幅圖像構(gòu)成掀序,包含對(duì)象的運(yùn)動(dòng)信息,又稱為運(yùn)動(dòng)圖像臂港。
2. 數(shù)字視頻
數(shù)字視頻:自然場(chǎng)景空間和時(shí)間的數(shù)字采樣表示森枪。
空間采樣
解析度(Resolution)
時(shí)間采樣
幀率:幀/秒
3. 空間采樣
二維數(shù)字視頻圖像空間采樣
4. 數(shù)字視頻系統(tǒng)
采集
照相機(jī)视搏,攝像機(jī)
處理
編解碼器,傳輸設(shè)備
顯示
顯示器
5. 人類視覺(jué)系統(tǒng)HVS
HVS
眼睛
神經(jīng)
大腦
HVS特點(diǎn):
對(duì)高頻信息不敏感
對(duì)高對(duì)比度更敏感
對(duì)亮度信息比色度信息更敏感
對(duì)運(yùn)動(dòng)的信息更敏感
6. 數(shù)字視頻系統(tǒng)的設(shè)計(jì)應(yīng)該考慮HVS的特點(diǎn):
丟棄高頻信息县袱,只編碼低頻信息
提高邊緣信息的主觀質(zhì)量
降低色度的解析度
對(duì)感興趣區(qū)域(Region of Interesting浑娜,ROI)進(jìn)行特殊處理
7. RGB色彩空間
三原色:紅(R),綠(G)式散,藍(lán)(B)筋遭。
任何顏色都可以通過(guò)按一定比例混合三原色產(chǎn)生。
RGB色度空間
由RGB三原色組成
廣泛用于BMP暴拄,TIFF漓滔,PPM等
每個(gè)色度成分通常用8bit表示[0,255]
8. YUV色彩空間
YUV色彩空間:
Y:亮度分量
UV:兩個(gè)色度分量
YUV更好的反映HVS特點(diǎn)
9. RGB轉(zhuǎn)化到Y(jié)UV空間
亮度分量Y與三原色有如下關(guān)系:
經(jīng)過(guò)大量實(shí)驗(yàn)后ITU-R給出了,
乖篷,
响驴,
主流的編解碼標(biāo)準(zhǔn)的壓縮對(duì)象都是YUV圖像
10.YUV圖像分量采樣
YUV圖像可以根據(jù)HVS的特點(diǎn),對(duì)色度分量下采樣撕蔼,可以降低視頻數(shù)據(jù)量豁鲤。
根據(jù)亮度和色度分量的采樣比率,YUV圖像通常有以下幾種格式:
11. 通用 的YUV圖像格式
根據(jù)YUV圖像的亮度分辨率定義圖像格式
12. 幀和場(chǎng)圖像
一幀圖像包括兩場(chǎng)——頂場(chǎng)鲸沮,底場(chǎng)
13. 逐行與隔行圖像
逐行圖像:一幀圖像的兩場(chǎng)在同一時(shí)間得到琳骡,ttop=tbot。
隔行圖像:一幀圖像的兩場(chǎng)在不同時(shí)間得到讼溺,ttop≠tbot楣号。
14. 視頻質(zhì)量評(píng)價(jià)
有損視頻壓縮使編解碼圖像不同,需要一種手段來(lái)評(píng)價(jià)解碼圖像的質(zhì)量怒坯。
質(zhì)量評(píng)價(jià):
客觀質(zhì)量評(píng)價(jià)
主觀質(zhì)量評(píng)價(jià)
基于視覺(jué)的視頻質(zhì)量客觀評(píng)價(jià)
客觀質(zhì)量評(píng)價(jià):通過(guò)數(shù)學(xué)方法測(cè)量圖像質(zhì)量評(píng)價(jià)的方式炫狱。
優(yōu)點(diǎn):
可量化
測(cè)量結(jié)果可重復(fù)
測(cè)量簡(jiǎn)單
缺點(diǎn):
不完全符合人的主觀感知
15. 客觀評(píng)價(jià)的方法
常用的客觀評(píng)價(jià)方法:
16. 主觀評(píng)價(jià)方法
主觀質(zhì)量評(píng)價(jià):用人的主觀感知直接測(cè)量的方式。
優(yōu)點(diǎn):
符合人的主觀感知
缺點(diǎn):
不容易量化
受不確定因素影響敬肚,測(cè)量結(jié)果一般不可重復(fù)
測(cè)量代價(jià)高
常用主觀評(píng)價(jià)方法
17.基于視覺(jué)的視頻質(zhì)量客觀評(píng)價(jià)方法
基于視覺(jué)的視頻質(zhì)量客觀評(píng)價(jià):將人的視覺(jué)特性用數(shù)學(xué)方法描述并用于視頻質(zhì)量評(píng)價(jià)的方式毕荐。
結(jié)合了主觀質(zhì)量評(píng)價(jià)和客觀質(zhì)量評(píng)價(jià)兩方面優(yōu)點(diǎn)。
常用方法:結(jié)構(gòu)相似度(Structural SIMilarity艳馒,SSIM)方法憎亚。
將HVS的特征用數(shù)學(xué)模型表達(dá)出來(lái)。
未來(lái)重要的研究方向
第3章 信息論基礎(chǔ)
1. 通信系統(tǒng)的組成
信源:產(chǎn)生消息
信道:傳輸消息
信宿:接收消息
2. 基本概念
通信中對(duì)信息的表達(dá)分為三個(gè)層次:信號(hào)弄慰,消息第美,信息。
信號(hào):是信息的物理層表達(dá)陆爽,可測(cè)量什往,可描述,可顯示慌闭。如電信號(hào)别威,光信號(hào)躯舔。
消息:是信息的載體,以文字省古,語(yǔ)言粥庄,圖像等人類可以認(rèn)知的形式表示锥腻。
信息:不確定的內(nèi)容搔体。
3. 信息熵
信息的特點(diǎn)
信息的測(cè)量
自信息量
條件信息量
4. 信息熵
5. 條件熵和聯(lián)合熵
6. 熵的性質(zhì)
非負(fù)性:信源熵是非負(fù)值纯出,即 H(X) >=0;
擴(kuò)展性:信源熵X有M個(gè)符號(hào)杰刽,如果其中一個(gè)符號(hào)出現(xiàn)的概率趨于零,信源熵就等于剩余M-1個(gè)符號(hào)的信源熵枣接;
極值性(最大信息熵):對(duì)于具有M個(gè)符號(hào)的信源做葵,只有在所有符號(hào)等概率出現(xiàn)的情況下椒功,信源熵達(dá)到最大值白嘁,即
可加性:
熵不增:條件熵不大于信息熵H(X|Y) <= H(X)坑鱼;
聯(lián)合熵不大于各信息熵的和,即H(XY) <= H(X) + H(Y)絮缅。
7. 互信息量
8. 互信息
物理意義:H(X)是X所含的信息姑躲,H(X|Y)是已知Y的條件下X還能帶來(lái)的信息量。那么兩者之差就是由于知道Y使得X減少的信息量盟蚣,也即由Y可以得到的關(guān)于X的信息量。
9. 各種熵的關(guān)系
11. 信源編碼
信源編碼:將消息符號(hào)轉(zhuǎn)變成信道可傳輸?shù)男畔ⅰ?/p>
兩個(gè)基本問(wèn)題:
用盡可能少的信道傳輸符號(hào)來(lái)傳遞信源消息卖怜,提高傳輸效率屎开;
減少由于信道傳輸符號(hào)的減少導(dǎo)致的失真。
12. 離散信源統(tǒng)計(jì)特性
13. 離散信源類型:簡(jiǎn)單無(wú)記憶信源和馬爾可夫信源
14. 編碼分類
等長(zhǎng)碼:在一組碼字集合C中的所有碼字cm(m= 1,2, …,M)马靠,其碼長(zhǎng)都相同奄抽,則稱這組碼C為等長(zhǎng)碼。
變長(zhǎng)碼:若碼字集合C中的所有碼字cm(m= 1,2, …,M)甩鳄,其碼長(zhǎng)不都相同逞度,稱碼C為變長(zhǎng)碼。
15. 平均碼長(zhǎng)
16. 等長(zhǎng)碼與變長(zhǎng)碼比較
等長(zhǎng)編碼將信源輸出符號(hào)序列的任意一種取值(概率可能不同)都編碼成相同長(zhǎng)度的輸出碼字妙啃,沒(méi)有利用信源的統(tǒng)計(jì)特性档泽;
變長(zhǎng)編碼可以根據(jù)信源輸出符號(hào)序列各種取值的概率大小不同,將他們編碼成不同長(zhǎng)度的輸出碼字揖赴,利用了信源的統(tǒng)計(jì)特性馆匿。因此又稱其為熵編碼。
17. Huffman編碼
Huffman編碼:典型的變長(zhǎng)編碼燥滑。
步驟:
將信源符號(hào)按概率從大到小的順序排列渐北,假定p(x1)≥p(x2)… ≥p(xn)
給兩個(gè)概率最小的信源符號(hào)p(xn-1),p(xn)各分配一個(gè)碼位"0"和"1"铭拧,將這兩個(gè)信源符號(hào)合并成一個(gè)新符號(hào)赃蛛,并用這兩個(gè)最小的概率之和作為新符號(hào)的概率恃锉,結(jié)果得到一個(gè)只包含(n-1)個(gè)信源符號(hào)的新信源。稱為信源的第一次縮減信源呕臂,用S1表表示破托。
將縮減信源S1的符號(hào)仍按概率從大到小的順序排列,重復(fù)步驟2诵闭,得到只含(n-2)個(gè)符號(hào)的縮減信源S2炼团。
重復(fù)上述步驟,直至縮減信源只剩下兩個(gè)符號(hào)為止疏尿,此時(shí)所剩兩個(gè)符號(hào)的概率之和必為1瘟芝。然后從最后一級(jí)縮減信源開始,依編碼路徑向前返回褥琐,就得到各信源符號(hào)所對(duì)應(yīng)的碼字锌俱。
18. 信道編碼
信道編碼主要考慮如何增加信號(hào)的抗干擾能力,提高傳輸?shù)目煽啃缘谐剩⑶姨岣邆鬏斝省?/p>
一般是采用冗余編碼法贸宏,賦予信碼自身一定的糾錯(cuò)和檢錯(cuò)能力,使信道傳輸?shù)牟铄e(cuò)概率降到允許的范圍之內(nèi)磕洪。
19. 信道類型
根據(jù)信道連續(xù)與否分類
離散信道
連續(xù)信道
半連續(xù)信道
根據(jù)信道是否有干擾分類
無(wú)干擾信道
有干擾信道
根據(jù)信道的統(tǒng)計(jì)特性分類
無(wú)記憶信道
有記憶信道
恒參信道
變參信道
對(duì)稱信道
非對(duì)稱信道
20. 信道容量
在信息論中吭练,稱信道無(wú)差錯(cuò)傳輸?shù)淖畲笮畔⑺俾蕿樾诺廊萘俊?/p>
仙農(nóng)信道容量公式:
假設(shè)連續(xù)信道的加性高斯白噪聲功率為N,信道帶寬為B析显,信號(hào)功率為S鲫咽,則該信道的容量為
由于噪聲功率N與信道帶寬B有關(guān),則噪聲功率N=n0B谷异。因此分尸,仙農(nóng)公式還可以表示為
21. 香農(nóng)信道容量公式的意義
在給定B和S/N的情況下,信道的極限傳輸能力為C歹嘹,而且此時(shí)能夠做到無(wú)差錯(cuò)傳輸箩绍。如果信道的實(shí)際傳輸速率大于C值,則無(wú)差錯(cuò)傳輸在理論上就已不可能尺上。因此材蛛,實(shí)際傳輸速率一般不能大于信道容量C,除非允許存在一定的差錯(cuò)率尖昏。
提高信噪比S/N(通過(guò)減小n0或增大S)仰税,可提高信道容量C。特別是抽诉,若n0->0陨簇,則C->∞ ,這意味著無(wú)干擾信道容量為無(wú)窮大;
增加信道帶寬B河绽,也可增加信道容量C己单,但做不到無(wú)限制地增加。這是因?yàn)榘沂危绻?i>S纹笼、n0一定,有
維持同樣大小的信道容量苟跪,可以通過(guò)調(diào)整信道的B及S/N來(lái)達(dá)到廷痘,即信道容量可以通過(guò)系統(tǒng)帶寬與信噪比的互換而保持不變。
22. 失真
失真:信源的消息經(jīng)過(guò)編解碼后不能完全復(fù)原
在實(shí)際的信源和信道編碼中件已,消息的傳輸并不總是無(wú)失真的笋额。
由于存儲(chǔ)和傳輸資源的限制
噪聲等因素的干擾
23. 率失真理論
仙農(nóng)定義了信息率失真函數(shù)R(D)
D是消息失真
R是碼率
率失真定理:在允許一定失真度D的情況下,信源輸出的信息率可壓縮到R(D)篷扩。
24. 失真函數(shù)
失真函數(shù):信源符號(hào)X={x1,x2, …..xn}兄猩,經(jīng)信道傳輸接收端符號(hào)Y={y1,y2….yn},對(duì)于每一對(duì)(xi,yj)指定一個(gè)非負(fù)函數(shù)d(xi,yj)鉴未,稱d(xi,yj)為單個(gè)符號(hào)的失真度或失真函數(shù)枢冤。對(duì)于連續(xù)信源連續(xù)信道的情況,常用d(x,y)表示铜秆。
常用失真函數(shù):
平均失真度:
原文:http://www.cnblogs.com/xkfz007/archive/2012/07/28/2613690.html
更多:http://www.cnblogs.com/xkfz007/archive/2012/07/29/2613824.html
http://www.cnblogs.com/xkfz007/archive/2012/07/29/2614250.html