深度剖析視頻基礎(chǔ)知識(2)

“隨著技術(shù)的不斷進(jìn)步沫浆,視頻技術(shù)的制作加工門檻逐漸降低警绩,信息資源的不斷增長,同時由于視頻信息內(nèi)容更加豐富完整的先天優(yōu)勢晓锻,在近年來已經(jīng)逐漸成為主流歌焦。在基礎(chǔ)知識(1)里面已經(jīng)講了模擬時代和數(shù)字化時代的視頻技術(shù)。接下來將對視頻編碼與壓縮带射、畫面壓縮同规、運動壓縮、互聯(lián)網(wǎng)視頻應(yīng)用的到來做一個詳細(xì)的介紹窟社∪祝”

視頻編碼與壓縮

視頻編碼與壓縮,是數(shù)字化視頻非常重要的技術(shù)灿里,以至于它直接影響到視頻在各個領(lǐng)域的應(yīng)用关炼。如果沒有視頻編碼技術(shù)的不斷提高,我們今天也不可能在方方面面享受到視頻的便利性匣吊。

首先儒拂,視頻編碼是一項非常復(fù)雜的工程,遠(yuǎn)超過對音頻和圖像壓縮的難度色鸳。其次社痛,視頻編碼是一個多級壓縮的過程,而非單一壓縮方案命雀。當(dāng)然如果不是有著這么復(fù)雜的一項工程蒜哀,視頻文件遠(yuǎn)比我們想象的要大的多。我們來舉一個例子:

按照CCIR 601的視頻信號采集標(biāo)準(zhǔn)吏砂,一個標(biāo)準(zhǔn)PAL制式電視信號轉(zhuǎn)換成數(shù)字信號撵儿,按照常見的非專業(yè)級采樣標(biāo)準(zhǔn)4:2:0(你想支持更高的也不行啊乘客,民用級的設(shè)備做不到更高的采樣率),則每秒鐘產(chǎn)生的視頻內(nèi)容所生成的數(shù)字文件為21MB淀歇。那么1分鐘的視頻文件有多大呢易核?1260MB那么大。

那么浪默,如果按照RGB色彩表達(dá)方式牡直,720×576分辨率,每個采樣點3個基色浴鸿,每個基色是8bit數(shù)據(jù)井氢,每秒25幀畫面。經(jīng)過簡單的計算岳链,我們很容易得出結(jié)果是720×576×3×8×25=237.3Mbit=29.67MByte。那么1分鐘的視頻就是1780MB劲件。我想從沒有用戶見到過1分鐘的視頻會生成這么大的文件吧掸哑。這還僅僅是標(biāo)清,如果是高清1080P的話零远,那就是69.5TB苗分!

從上面的例子可以看出,即便是不壓縮視頻牵辣,采用YUV顏色來存儲信息摔癣,比起使用RGB顏色來存儲信息,容量還是要小一些的纬向。所以也可以說YUV顏色方式算是視頻編碼的最初一級壓縮方法择浊。

這里面需要穿插一個話題,關(guān)于色階逾条。

色階的意思琢岩,就是顏色從無到最大時,中間的過渡梯級有多少师脂。假如說亮度的黑白信號担孔,色階為2時,那么它就只有兩種顏色吃警,全白和全黑糕篇。那如果變?yōu)?56級是(比較常見的色階標(biāo)準(zhǔn)),結(jié)果就是下面這樣:

同樣的RGB三基色中酌心,每種顏色都有色階拌消。8bit數(shù)據(jù)能夠存儲256個色階,那么RGB三基色就可以實現(xiàn)1677萬種顏色谒府,也就是24位色拼坎。

注:計算機(jī)顏色體系中有32位色浮毯,實際上是24位色之外增加了一個8位的Alpha透明層,所以也叫RGBA泰鸡。

那能不能使用更高的色階呢刽宪?大于256級色階好不好贤笆?當(dāng)然好了,不過一般的顯示器不支持。但是的確是有高色階的顯示器衷佃,目前色階最高的顯示器可以支持10bit顏色信息,也就是1024級色階芥玉。當(dāng)然價格是不可想象的发绢!

EIZO GX540醫(yī)學(xué)顯示器,1024級色階黑白顯示器 價格不明匿值,但不會少于10萬元

SONY BVM-X300主控監(jiān)視器赠制,OLED顯示10bit彩色 可以顯示10億種顏色

還有得告訴大家一個不好的消息,一般民用的低端顯示器采用的TN型液晶面板挟憔,都是6bit的钟些,也就是RGB每種顏色只有64級,一共可以顯示顏色只有26萬種绊谭。當(dāng)然你可以選擇32位色模式政恍,只不過它的1677萬種顏色,是通過插值換算出來的达传,并不是真正的1677萬種顏色篙耗。真正支持1677萬種顏色的顯示器,其實也不是很便宜的宪赶。

畫面壓縮

如果每一幀的視頻畫面宗弯,按照RGB顏色保存的話,文件會非常大逊朽。例如PAL制視頻畫面所產(chǎn)生的文件有1.2MB罕伯。

如果將每幀的視頻畫面壓縮,那么可能大大減小視頻的文件大小叽讳。而我們所知的最常見圖像壓縮算法就是jpeg追他。JPEG 是Joint Photographic Experts Group(聯(lián)合圖像專家小組)的縮寫,是第一個國際圖像壓縮標(biāo)準(zhǔn)岛蚤。

首先JPEG壓縮是對圖像的YUV色彩分量進(jìn)行分別編碼邑狸,所用的編碼主要算法是DCT(DCT for Discrete Cosine Transform,離散余弦變換)涤妒。它是與傅里葉變換相關(guān)的一種變換单雾,它類似于離散傅里葉變換(DFT for Discrete Fourier Transform),但是只使用實數(shù)。DCT是一種非常高壓縮率低失真的壓縮算法,可以將圖像壓縮至1/5到1/10大小硅堆,而且畫質(zhì)基本沒有太大變化屿储。

那么利用JPEG壓縮算法,原本每幀圖像大小為1.2MB渐逃,現(xiàn)在就變成了180KB左右够掠,減小了很多。而每秒鐘的視頻大小就變成了4.4MB茄菊,1分鐘的視頻就是263MB疯潭。頓時小了很多。使用這種算法的視頻編碼方式叫做Motion JPEG面殖,也叫MJPEG竖哩。注意,視頻壓縮里面也有個比較知名的方法叫做MPEG脊僚,但不等同于MJPEG相叁,兩者截然不同。

運動壓縮

雖然通過JPEG算法吃挑,可以將視頻變小了好幾倍钝荡,但是還是比較大。對于傳輸來說和存儲來說舶衬,門檻還是太高了,只能適合像廣播電視行業(yè)這種專業(yè)機(jī)構(gòu)使用赎离。

那么還有什么辦法可以把視頻文件壓縮的更小呢逛犹?那就是幀間壓縮方法。

說到幀間壓縮梁剔,那必須提到一個組織虽画,MPEG(Moving Picture Experts Group,動態(tài)圖像專家組)是ISO(International Standardization Organization荣病,國際標(biāo)準(zhǔn)化組織)與IEC(International Electrotechnical Commission码撰,國際電工委員會)于1988年成立的專門針對運動圖像和語音壓縮制定國際標(biāo)準(zhǔn)的組織。

現(xiàn)在知道了吧个盆,MPEG其實是一個組織的名字脖岛。當(dāng)然這個組織有很多有代表性的壓縮算法,都是以MPEG-X命名的颊亮。所以大家也就習(xí)慣的把MPEG稱作壓縮方法柴梆。

首先,運動壓縮采用的是幀間壓縮法终惑。而什么是幀間壓縮法呢绍在?

由于視頻是由很多幀的畫面集合組成,而鑒于運動的特性,在很短的間隔時間內(nèi)運動幅度很小偿渡。另外就是運動的畫面中臼寄,存在很多并沒有運動的畫面信息。甚至有時候拍攝的畫面有很多幀圖像之間幾乎沒有變化溜宽。這樣重復(fù)的記錄這些沒有變化的圖像信息吉拳,簡直是太浪費了。

幀間壓縮坑质,就是盡可能的剔除那些相鄰畫面中沒有變化的內(nèi)容信息合武。舉個例子,比如畫面是一個人騎自行車涡扼,背景不變稼跳,而騎自行車的人從畫面一端跑到另外一端。那么這個時候吃沪,就可以把沒有遮蓋到的背景部分汤善,只保存一份就行了。剩下的只是記錄人騎自行車的整個動態(tài)畫面就OK票彪。

當(dāng)時原理上比較簡單红淡,實現(xiàn)起來就比較困難了。幀間壓縮的時候首先要用到關(guān)鍵幀和非關(guān)鍵幀的概念降铸。關(guān)鍵幀就是指你要保存畫面上所有數(shù)據(jù)的那一幀圖像在旱,并且以這個圖像作為參考。關(guān)鍵幀后面每一幀都會比照關(guān)鍵幀和此前一幀的畫面推掸,記錄畫面改變的地方桶蝎,去掉重復(fù)的信息。

早期的壓縮算法就是采取這種策略谅畅,比如MPEG-1登渣。它的應(yīng)用產(chǎn)品大家可能更熟悉——VCD。

這里順便提一下MP3毡泻,MP3的全名叫做MPEG-1 layer3胜茧。也就是說MP3壓縮格式是MPEG-1壓縮標(biāo)準(zhǔn)里面的一個子集。跟MP4是完全不同的概念仇味。

VCD雖然在一張光盤里(650MB容量)可以放得下差不多一部電影的長度呻顽,已經(jīng)是壓縮率很驚人了。當(dāng)然這也是犧牲畫面為前提的:

VCD的分辨率很低邪铲,只有352×288(對應(yīng)PAL制)芬位,比標(biāo)準(zhǔn)的電視畫面的清晰度小很多。

VCD在運動不太明顯的情況下畫質(zhì)還可以接受带到,如果是運動很快的畫面中昧碉,就會出現(xiàn)很多慘不忍睹的馬賽克英染。

有了VCD產(chǎn)品,國人們是皆大歡喜被饿。這里可以順帶講一下四康,VCD機(jī)是中國人發(fā)明的,那家公司叫萬燕狭握。但是呢闪金,VCD技術(shù)是飛利浦、SONY论颅、松下哎垦、JVC等公司聯(lián)合制定的標(biāo)準(zhǔn),而生產(chǎn)VCD芯片的公司是美國的C-CUBE公司恃疯。怎么說呢漏设,技術(shù)雖然是老外們發(fā)明的,不過他們并不看重這項技術(shù)今妄,所以就沒形成產(chǎn)品郑口。反倒是國人把它發(fā)揚光大了。

與此同時盾鳞,歐美國家其實對VCD是不太感冒的犬性。因為他們還在VHS時代(感興趣的同學(xué)可以搜索一下VHS,以及SONY的betacam與JVC的VHS制式標(biāo)準(zhǔn)大戰(zhàn))腾仅,而且VCD第一不便宜乒裆,第二畫質(zhì)也不高,第三還不能錄像只能播放推励。

其實有了VCD產(chǎn)品之后缸兔,對世界還是很震驚的。大家都覺得把一部電影放在一張小小的碟片里面真的很方便吹艇。但是VCD畫質(zhì)真的不好,有沒有什么新的技術(shù)可以做到更小的容量更高的清晰度呢昂拂?那就是后來推出的MPEG-2受神。

MPEG-2這個標(biāo)準(zhǔn)是最早風(fēng)靡全球的壓縮技術(shù),標(biāo)準(zhǔn)制定的時間是1994年(VCD標(biāo)準(zhǔn)是1993年)格侯。雖然已經(jīng)過去20多年了鼻听,卻仍然是當(dāng)今最重要的視頻壓縮格式之一。除了還有大量的DVD產(chǎn)品以外联四,更重要的是目前廣播電視領(lǐng)域的數(shù)字電視DVB-T標(biāo)準(zhǔn)撑碴,仍然使用的是MPEG-2壓縮標(biāo)準(zhǔn)(在中國)。

MPEG-2相對于MPEG-1有什么提升呢朝墩?

1. 畫面有了很大的提升醉拓,且更加靈活了。MPEG-1幾乎所有的應(yīng)用都集中在VCD上,分辨率很小亿卤,且不能改變愤兵。MPEG-2可以適合中等清晰度(D1標(biāo)準(zhǔn)、PAL制或者NTSC等制式電視標(biāo)準(zhǔn))到高清晰度視頻內(nèi)容的展示排吴。也就是說即便是720P秆乳、1080P等這樣的高分辨率視頻,MPEG-2仍然適用钻哩。

2. 增加了GOP模式屹堰,使用IBP幀結(jié)構(gòu)。原來的幀間壓縮方式街氢,在大動態(tài)場景下馬賽克很嚴(yán)重扯键。到了MPEG-2之后就有了很大的提升,因為使用了參考幀B幀阳仔,使用了向前預(yù)測幀方式忧陪,而且壓縮率是可變的〗叮總的來說嘶摊,就是大動態(tài)時候不會有馬賽克了。

3. 增加了很多額外的信息评矩,功能更加強(qiáng)大叶堆。比如支持更強(qiáng)的交互與命令控制(大家有沒有想起來VCD 2.0時候畫面有菜單可以選,DVD比這個強(qiáng)大)斥杜,支持傳輸流形式(TS虱颗,TransportStream,就是可以用于直播蔗喂,也不怕文件損壞就全完)忘渔,多音軌而且多聲道。

但是MPEG-2也有不足的缰儿,主要就是它是面向工業(yè)化視頻信息生產(chǎn)發(fā)行領(lǐng)域的畦粮,也就是說只適合電視臺、DVD發(fā)行商乖阵、衛(wèi)星通信等領(lǐng)域宣赔,不適合民用。因為碼流真的很大瞪浸,比MPEG-1要大儒将。雖然一張光盤就可以裝的下一整部電影,那是因為光盤的容量從650MB提升到了4.3GB对蒲,甚至7.2GB钩蚊。

互聯(lián)網(wǎng)視頻應(yīng)用的到來

早期的寬帶速度只有1~2Mbps(56K modem和ISDN時代根本就沒視頻什么事)贡翘,想要在線播放DVD影片是不可能的(至少5~10Mbps),VCD也不行而且技術(shù)上不支持两疚。MPEG組織的科學(xué)家就開始研究能夠適合在網(wǎng)絡(luò)上播放的視頻壓縮方法床估,也就是后面推出的MPEG-4壓縮格式。

MPEG-4很明顯的特征就是適合在網(wǎng)絡(luò)上播放诱渤,靈活度更高丐巫,功能更加強(qiáng)大:

壓縮比更高更靈活。MPEG-1壓縮比為20~30倍勺美,MPEG-2壓縮比為10~20倍递胧,MPEG-4壓縮比從幾十到一百多倍不等;

對于畫面內(nèi)容可以使用不同的壓縮比率赡茸,可以對非重要對象使用高壓縮比缎脾,對重要對象使用低壓縮比。這樣可以在保證主要畫質(zhì)情況下壓縮比更高占卧;

不同對象可以使用不同編碼算法遗菠,進(jìn)一步提升壓縮效率;

音視頻搭配更靈活华蜒;

交互性更強(qiáng)辙纬,尤其適合互聯(lián)網(wǎng)這種模式。

MPEG-4后來產(chǎn)生了很多衍生壓縮算法叭喜,比較著名的就是Xvid和Dvix了贺拣。其實MPEG-4的知名度不如Xvid和Dvix,因為在那個時期捂蕴,MPEG-4為了適應(yīng)互聯(lián)網(wǎng)較低的帶寬速度譬涡,大部分應(yīng)用都是一些低分辨率低碼流的視頻。而Xvid和Dvix雖然源自MPEG-4體系啥辨,但是面向視頻文件存檔進(jìn)行了優(yōu)化涡匀,可以比DVD小3~4倍的大小,存儲與DVD畫質(zhì)非常接近的視頻內(nèi)容溉知。受到了用戶的極大喜愛渊跋,以至于在那個時期已經(jīng)成為盜版影片的必選格式。

RealMedia——曾經(jīng)的王者

曾經(jīng)互聯(lián)網(wǎng)視頻最大的贏家是Real Network着倾,也是它最早實現(xiàn)了基于互聯(lián)網(wǎng)的流媒體視頻(在線觀看)。想當(dāng)年還在56K Modem窄帶時期燕少,Real Network公司就已經(jīng)提供了視頻在線觀看功能卡者。筆者曾經(jīng)在那個還在PSTN上進(jìn)行撥號的時代,體驗過通過realplayer觀看NBA的直播客们。如果以現(xiàn)在的標(biāo)準(zhǔn)來衡量那個時期的產(chǎn)品崇决,那就是延時巨大(經(jīng)常要loading幾分鐘)材诽、畫質(zhì)慘不忍睹(分辨率超低,馬賽克嚴(yán)重)恒傻、經(jīng)常性的卡頓脸侥。

但是隨著寬帶的逐漸普及,RealMedia的巨大優(yōu)勢得以施展盈厘。在那個時期睁枕,RealMedia是當(dāng)之無愧的王者。

首先沸手,RealMedia壓縮標(biāo)準(zhǔn)并非是MPEG-4衍生的版本外遇,而是一個私有的壓縮標(biāo)準(zhǔn)。這個標(biāo)準(zhǔn)由Real Network公司創(chuàng)立契吉,且獨有跳仿。RealMedia擁有極大的壓縮比,遠(yuǎn)超MPEG家族捐晶。比如說一部標(biāo)準(zhǔn)DVD格式的電影菲语,大約4.3GB容量,如果采用Dvix壓縮的話惑灵,大概能壓縮到700MB山上,而使用RM格式壓縮,連700MB的一半都不到泣棋。即便是到了后期的RMVB壓縮格式胶哲,也基本不會超500MB。

第二潭辈,Real Network公司在當(dāng)時提供了世界上最完善的流媒體系統(tǒng)方案鸯屿,只不過是收費的。那個時候的競爭對手只有微軟的Windows Media Encoder把敢,免費但是功能不完善寄摆。而RealMedia Encoder提供了VOD模式和LIVE模式完整的流媒體解決方案,雖然比較貴(印象中大概1萬多美金)修赞。

對于商業(yè)化應(yīng)用的企業(yè)而言婶恼,要想做直播和點播業(yè)務(wù),自然RealMedia Encoder服務(wù)會更加靠譜柏副。雖然是收費的勾邦,但是系統(tǒng)穩(wěn)定、可靠性強(qiáng)割择、又有服務(wù)支持(Windows Media Encoder只能在MSDN社區(qū)尋求幫助眷篇,沒有技術(shù)支持)。所以說那個時期Real公司已經(jīng)處于壟斷地位了荔泳。

不過在那個時期蕉饼,Real公司面臨最大的問題是盜版虐杯。因為RealMedia的播放器雖然是免費的,但是編碼器昧港、解碼器擎椰、流媒體服務(wù)器等等都是收費的。隨著real格式日漸盛行创肥,盜版就變得非常猖獗达舒。當(dāng)然Real公司沒有微軟那么財大氣粗,所以自然要到處封殺瓤的。這只能說是在21世紀(jì)初期的互聯(lián)網(wǎng)現(xiàn)狀休弃,如果要是放到現(xiàn)在,像Real這種公司風(fēng)投還不擠破大門圈膏?公司的估值少說也得幾百億美金吧塔猾。

可惜的是,由于封閉而且收費稽坤,加上到處封殺丈甸,給了競爭對手很多機(jī)會。然后就有了Flash流媒體的崛起尿褪。

RealMedia能強(qiáng)大到什么程度呢睦擂?在21世紀(jì)初一直到2010年之前的差不多十年間,real格式一度成為了互聯(lián)網(wǎng)視頻格式的幾乎唯一選擇杖玲。那時候幾乎所有盜版的電影和視頻文件顿仇,全都是基于RM和RMVB格式的。21世紀(jì)以前呢摆马?那是avi的天下臼闻,科科。

RealMedia的視頻壓縮主要分為兩個階段囤采,第一階段就是RM格式述呐,第二階段是RMVB。由于RM格式雖然壓縮率出奇的高蕉毯,但帶來的問題就是畫質(zhì)很差乓搬,馬賽克嚴(yán)重。隨著寬帶逐漸普及代虾,人們對畫質(zhì)的要求逐漸提高进肯,加上競爭對手的壓力(Dvix和Xvid),RM升級到了RMVB棉磨。多出來“VB”這兩個字幕坷澡,其實指的就是“Variable Bitrate”動態(tài)碼率或者叫可變碼率。關(guān)于碼率的解釋我們在文章最后來做。

RM升級到RMVB之后频敛,一直被詬病的畫質(zhì)問題得到了提升,同時也可以支持較高的清晰度(最大到720P)馅扣。但是RMVB推出的時間已經(jīng)晚于競爭對手斟赚,加上商業(yè)化的原因,以及更新速度越來越慢差油。最終消失在互聯(lián)網(wǎng)的視野中拗军。

Flash Video的崛起

不同于RealMedia的全行業(yè)流行,F(xiàn)lash Video(以下簡稱FLV)主要應(yīng)用在流媒體領(lǐng)域蓄喇,提供VOD點播和LIVE直播服務(wù)发侵。與Dvix和Xvid一起成為了第二階段的黃金組合。

FLV的壓縮編碼也不是源自MPEG-4妆偏,而是另外一個強(qiáng)大的標(biāo)準(zhǔn)H.26x體系刃鳄,最早出現(xiàn)在1997年的MacWorld Expo大會上。說來很有意思钱骂,F(xiàn)LV天生就和蘋果是一對叔锐,到最后卻被蘋果拋棄。

首先见秽,F(xiàn)LV并非是一種壓縮編碼格式愉烙,而是封包格式(比如AVI、MKV解取、MP4步责、MOV這些文件,都是一種封包格式禀苦。關(guān)于封包格式的問題蔓肯,由于涉及技術(shù)過深,在這里暫不作詳解伦忠。感興趣的用戶可以自己了解掌握省核,@我也行哦)。FLV采用的視頻壓縮編碼其實有蠻多的昆码,開始是Sorenson Video和Sorenson Video Pro气忠,以及Sonrenson Spark;后來加入了Sorenson MPEG 1/2/4赋咽,再后來就是目前最流行的H.264旧噪。

其實早期Sonrenson的很多壓縮編碼格式源自QuickTime壓縮編碼,也是基于H.263的壓縮編碼應(yīng)用脓匿。所以我們就不單獨介紹這種編碼的特點了淘钟。

至于FLV在市場上的表現(xiàn),其實大部分人都可能比較了解陪毡。畢竟國內(nèi)的視頻大站米母,比如優(yōu)酷土豆勾扭、酷6、PPS铁瞒、PPTV等妙色,早期全都是用的FLV;國外的大站如youtube也是最早的FLV用戶慧耍。只是隨著蘋果公司倡導(dǎo)的全面去flash化運動身辨,所有視頻大站不得不開始往HTML5轉(zhuǎn)型。

Windows Media Video

WMV一直是一種不溫不火的壓縮編碼格式芍碧,出道很早煌珊,但應(yīng)用很少。早在RealMedia時期泌豆,微軟就已經(jīng)推出了WMV壓縮格式定庵。并可以配合Windows Media Encoder實現(xiàn)流媒體應(yīng)用,也可以單獨編碼以文件形式存儲践美∠捶。可以說路數(shù)跟Real公司一樣,只不過是免費的陨倡。

其實Windows Media Encoder(以下簡稱WME)一直都沒有什么起色敛滋,屬于那種歷史悠久但無人知曉的品種。早期在跟RealMedia競爭中處于下風(fēng)兴革,但至少有不少用戶知道绎晃。后來有了FLV之后,基本就看不到WME的身影了杂曲。

至于WMV的壓縮格式庶艾,最開始也是一種私有格式。只不過到了WMV 9.0的時候擎勘,微軟向SMPTE學(xué)會提交的標(biāo)準(zhǔn)化方案咱揍,并入到了VC-1標(biāo)準(zhǔn)體系中。也就是其他家也可以共享這種編碼技術(shù)棚饵。

在早期的WMV標(biāo)準(zhǔn)里面煤裙,比如WMV 7.0,是基于MPEG-4 part2實現(xiàn)的編碼算法噪漾。最早期的版本沒有資料硼砰,但是可以看得出,WMV主流的版本主要是基于MPEG-4編碼的欣硼。

H.26x家族

除了知名度很高的MPEG組織(隸屬于ISO國際標(biāo)準(zhǔn)化組織下面的部門)题翰,還有一個在視頻編碼壓縮領(lǐng)域有突出貢獻(xiàn)的組織,那就是VCEG(Video Coding Experts Group,視頻編碼專家組)豹障。VCEG屬于另外一個非常厲害的組織ITU(國際電信聯(lián)盟)下屬的部門冯事,可能大部分人都不知道這個名字,但你一定知道他們提供的標(biāo)準(zhǔn)——H.264血公。

VCEG組織主要編撰的是H.26x標(biāo)準(zhǔn)體系桅咆,主要有H.261,H.263坞笙,H.264。

H.261主要是面向視頻會議領(lǐng)域的荚虚,也主要應(yīng)用在監(jiān)控安防領(lǐng)域薛夜。前面曾講到的,都是低分辨率低碼流視頻版述。

H.263 算是H.261的加強(qiáng)版本梯澜,主要是支持更高的分辨率(16CIF),采用了更高級的運動補(bǔ)償算法渴析。后期又升級到了H.263+和H.263++晚伙,使得算法性能和分辨率等都有了明顯的提升。

除了知名度很高的H.264以外俭茧,還有一個H.262標(biāo)準(zhǔn)咆疗,只不過應(yīng)用非常少,就不講了母债。

H.264午磁、MPEG-4 part10 AVC

目前大家最熟悉的壓縮編碼格式莫過于H.264了,其實它還有另外一個名稱MPEG-4 part10 AVC毡们。

原因是這個標(biāo)準(zhǔn)不是一家制定的迅皇,而是兩家世界上最權(quán)威的編碼專家組織一同來完成的。那就是ITU下面的VCEG組織和ISO下面的MPEG組織衙熔。大家有興趣的話登颓,可以搜索一下ITU,就知道它在世界標(biāo)準(zhǔn)體系里面的重要性了红氯。目前全世界的通信網(wǎng)絡(luò)標(biāo)準(zhǔn)框咙,比如2G的GSM、3G的WCDMA脖隶、TD-SCDMA扁耐、CDMA2000,以及4G的FDD-LTE和TDD-LTE都是ITU來發(fā)布的产阱。

H.264/MPEG-4 AVC是融合了兩家權(quán)威組織的知識結(jié)晶婉称,是目前世界上最優(yōu)秀的編碼算法。它的特點非常多,我只列舉一下大家能感知到的一些特點王暗。更多的內(nèi)容大家可以自行查閱資料悔据。

編碼壓縮率較高,也很靈活俗壹。同等畫質(zhì)下科汗,壓縮率為MPEG-2的2倍,MPEG-4的1.5~2倍绷雏。而且可以用很高的碼率(MPEG-2接近)和很低的碼率(MPEG-2的1/8)头滔,來實現(xiàn)更快的傳輸需要和更高的畫質(zhì)需要。

動態(tài)效果更出色涎显,基本上徹底消除了馬賽克現(xiàn)象坤检。比如像《變形金剛》電影里面的大動態(tài)場景,你仍然可以非常清晰的看清畫面期吓。

壓縮效率更高早歇,比如靜態(tài)畫面可以實現(xiàn)超高的壓縮比。這是因為H.264/MPEG-4 AVC最大程度的去除冗余數(shù)據(jù)讨勤,使得編碼效率提升箭跳。

錯誤修復(fù)能力,可以在網(wǎng)絡(luò)QOS較差的環(huán)境下更高效率的傳輸潭千。

適合各種行業(yè)應(yīng)用谱姓,不管是視頻會議、安防監(jiān)控這類的高壓縮使用脊岳,還是互聯(lián)網(wǎng)流媒體的動態(tài)網(wǎng)絡(luò)環(huán)境使用逝段,以及廣播電視這類高畫質(zhì)標(biāo)準(zhǔn)使用。所以你看到的結(jié)果就是割捅,幾乎所有行業(yè)都在使用這個標(biāo)準(zhǔn)(國內(nèi)的有線電視仍然是MPEG-2奶躯,主要是由于有線電視的帶寬很高且目前還比較充裕,加上技術(shù)升級成本很高)亿驾。比如小到CIF尺寸的視頻嘹黔,大到4K標(biāo)準(zhǔn)的電影文件,你會發(fā)現(xiàn)他們基本都是基于H.264/MPEG-4 AVC壓縮的莫瞬。

行業(yè)應(yīng)用廣泛還得益于H.264/MPEG-4 AVC這種編碼格式的產(chǎn)品線健全儡蔓。

大家可能都知道的一個道理,當(dāng)壓縮率越高的時候(同等畫質(zhì)下)疼邀,編碼就越復(fù)雜锌蓄,計算量越高焙蹭。對H.264的編碼和解碼携悯,其計算量比過去的MPEG-2雳灾、MPEG-4等都高了很多涨岁。所以也就會出現(xiàn)較早期的電腦在軟解碼(CPU解碼)H.264視頻的時候,容易出現(xiàn)卡頓吉嚣。就是因為對計算性能要求較高梢薪。

但是好在有大量的專用編碼解碼芯片,以及專門對H.264編解碼優(yōu)化過的GPU(手機(jī)GPU和電腦顯卡GPU)尝哆,使得流暢性和速度得到了保障秉撇。所以你會發(fā)現(xiàn)某些高畫質(zhì)的視頻,可能在電腦上播放會很卡秋泄,但是在一些機(jī)頂盒上播放會非常流暢琐馆。

H.265

其實在H.264還沒流行起來,H.265標(biāo)準(zhǔn)就已經(jīng)建立了恒序。主要特點是壓縮效率進(jìn)一步提升啡捶,對UHDTV的支持,更好的信噪比等等奸焙。

目前已經(jīng)有一部分手機(jī)、監(jiān)控安防設(shè)備彤敛、視頻會議設(shè)備開始使用H.265編碼格式与帆。預(yù)計以后會更多,并且逐漸普及墨榄。

QuickTime家族

說起QuickTime玄糟,大家一定會想起蘋果公司。沒錯袄秩,quicktime就是蘋果公司推出的一整套編碼阵翎、解碼、播放和流媒體解決方案之剧。quicktime的壓縮格式早期是私有的郭卫,由于早期MAC系列電腦(那時候沒有iphone)普及率很低,所以使用quicktime這種格式的非常少背稼,包括他們的流媒體應(yīng)用贰军。

只是到了后期,隨著iphone的大量用戶蟹肘,quicktime才被大家所知词疼。但這個時候蘋果早就將quicktime標(biāo)準(zhǔn)加入到了MPEG-4標(biāo)準(zhǔn)體系中,以及后來H.264出現(xiàn)帘腹。結(jié)果大家都清楚了贰盗,蘋果目前也在用H.264壓縮標(biāo)準(zhǔn)。

壓縮編碼全集

其實除了上面講到的主流非主流的視頻壓縮編碼格式以外阳欲,還有很多大家不了解的舵盈。因為應(yīng)用非常少陋率,且現(xiàn)在幾乎都是被H.264統(tǒng)一了市場,所以就不做介紹了书释。下面的表格是目前所有的視頻壓縮編碼標(biāo)準(zhǔn)集合:

關(guān)于碼流的詳解

簡單的說碼流就是視頻每秒大概產(chǎn)生多大的視頻文件翘贮,一般以bps(bit per second每秒產(chǎn)生比特數(shù))為單位。其中b代表bit(比特)爆惧,跟B容易混淆狸页。其實B代表Byte,意為“字節(jié)”扯再。1Byte字節(jié)=8bit比特芍耘。一般存儲文件時,通常用B表示熄阻;傳輸文件時斋竞,為了表達(dá)速度時一般用b表示。

碼流常用于視頻傳輸時標(biāo)記視頻屬性的秃殉,這是因為流媒體坝初,尤其是直播體系中,文件的大小沒有太多意義钾军。因為觀眾可能是隨時進(jìn)來觀看的鳄袍,那么一直等到他觀看結(jié)束后,才能獲取到視頻文件的大小吏恭。還有一點就是TS流文件不需要從開始讀取拗小,它本身就沒有文件頭尾的概念,可以從任何一個片段開始讀取樱哼。所以這時候文件大小的意義也不大哀九。

那么為了準(zhǔn)確評估視頻,需要用到碼流這個參數(shù)搅幅。因為碼流代表你每秒需要傳輸?shù)臄?shù)據(jù)量阅束,需要與你的網(wǎng)絡(luò)進(jìn)行匹配。假如你的網(wǎng)絡(luò)帶寬是2Mbps茄唐,這代表理想狀態(tài)下围俘。那么如果你播放碼率為1.5Mbps(約等于1500Kbps)的流媒體視頻,就很可能會卡頓琢融。主要原因是網(wǎng)絡(luò)QOS(Quality of Service界牡,服務(wù)質(zhì)量)的問題,它無法保證數(shù)據(jù)一直都能以最高速度傳輸漾抬,畢竟網(wǎng)絡(luò)環(huán)境很復(fù)雜宿亡。

在早期的時候,壓縮編碼標(biāo)準(zhǔn)都采用的是恒定碼流編碼形式(CBR模式)纳令,即每秒鐘產(chǎn)生的視頻文件大小是完全一樣的挽荠。例如MPEG-1的碼流就是1.5Mbps克胳,那么60分鐘的視頻產(chǎn)生的文件就是675MB,正好一張VCD光盤的容量圈匆。

等到了MPEG-4時代漠另,由于網(wǎng)絡(luò)環(huán)境的復(fù)雜性,如果采用恒定碼流的策略跃赚,在網(wǎng)絡(luò)速度突然變差的時候笆搓,視頻就容易卡頓。另外就是視頻畫面里面如果有存在大動態(tài)場景的時候纬傲,原先的碼流可能會引起畫質(zhì)變差满败,需要臨時降低一下壓縮率。所以根據(jù)這兩種情況的應(yīng)用叹括,在流媒體直播編碼和視頻壓縮編碼時根據(jù)實際情況可以采取不同的碼流算墨。所以就產(chǎn)生了可變碼流編碼形式(VBR模式)。

在進(jìn)行VBR編碼時汁雷,為了充分提高壓縮編碼率净嘀,可以采用2次壓縮法,也就是2pass侠讯。但是2次壓縮法會大大降低壓縮的速度面粮,雖然視頻碼流更低畫質(zhì)更好,但編碼時間也大大拉長继低。

END

小貼士

老司機(jī)帶你了解一下常見的電影文件信息及特點

現(xiàn)在很多電影的文件看起來都比較長,大家不一定能夠理解稍走。例如下面的:

Children.Of.Man.2006.BDRE.1080p.x264.AC3-SiLUHD.mkv

對于這樣的文件名稱袁翁,需要拆分開來看。

l 剛開始肯定是影片或電視劇名稱婿脸,但有時候后面會有一些后綴來表示版本的特殊性粱胜,比如Director’s表示導(dǎo)演剪輯版、Unrated表示未分級版狐树、Limited表示有限放映版本焙压;

l 第二部分是發(fā)行年份,比如上面的2006抑钟;

l 第三部分是視頻來源涯曲,比如上面的BDRE,表示是來自于藍(lán)光盤(BD)進(jìn)行了重編碼在塔。同樣的表示方法還有HDrip表示從HD-DVD重新壓制幻件、HR-HDTV表示從高清電視信號重新壓制、還有TVrip等蛔溃。另外有些標(biāo)識為CAM表示從電影院用攝像機(jī)偷拍的绰沥、TS表示雖然在電影用攝像機(jī)偷拍篱蝇,但是音頻用的是影院提供的音頻輸出所以音頻沒有影院的干擾、TC表示直接從膠片上專制拷貝的(沒有數(shù)字化處理過徽曲,亮度不行零截,畫質(zhì)很一般);

l 第四部分是當(dāng)前視頻的分辨率秃臣,很明顯上面的1080P代表就是1920×1080分辨率涧衙,逐行掃描;

l 第五部分是當(dāng)前視頻使用的壓縮格式甜刻,上面的X264表示使用X264編碼器壓縮的绍撞,另外還有些Xvid等等都表示用的編碼器。比較特殊的是REMUX代表從高清光盤(BD或HD-DVD)中直接提取視頻數(shù)據(jù)重新封裝(沒有做重編碼)得院。畫質(zhì)最高傻铣,但一般文件也會非常大;

l 第六部分是當(dāng)前影片音頻的壓縮編碼格式祥绞,常見的有DTS非洲、AC3、DD5.1蜕径、AAC两踏、LPCM、MP3兜喻。當(dāng)然有些使用了次世代高清音頻格式梦染,比如DTSHD,TrueHD朴皆;

l 橫線之后的表示是壓制小組的名稱帕识。

有沒有g(shù)et新技能!比心遂铡!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末肮疗,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子扒接,更是在濱河造成了極大的恐慌伪货,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,366評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件钾怔,死亡現(xiàn)場離奇詭異碱呼,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)宗侦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評論 3 395
  • 文/潘曉璐 我一進(jìn)店門巍举,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人凝垛,你說我怎么就攤上這事懊悯◎涯保” “怎么了?”我有些...
    開封第一講書人閱讀 165,689評論 0 356
  • 文/不壞的土叔 我叫張陵炭分,是天一觀的道長桃焕。 經(jīng)常有香客問我,道長捧毛,這世上最難降的妖魔是什么观堂? 我笑而不...
    開封第一講書人閱讀 58,925評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮呀忧,結(jié)果婚禮上师痕,老公的妹妹穿的比我還像新娘。我一直安慰自己而账,他們只是感情好胰坟,可當(dāng)我...
    茶點故事閱讀 67,942評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著泞辐,像睡著了一般笔横。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上咐吼,一...
    開封第一講書人閱讀 51,727評論 1 305
  • 那天吹缔,我揣著相機(jī)與錄音,去河邊找鬼锯茄。 笑死厢塘,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的肌幽。 我是一名探鬼主播晚碾,決...
    沈念sama閱讀 40,447評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼牍颈!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起琅关,我...
    開封第一講書人閱讀 39,349評論 0 276
  • 序言:老撾萬榮一對情侶失蹤煮岁,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后涣易,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體画机,經(jīng)...
    沈念sama閱讀 45,820評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,990評論 3 337
  • 正文 我和宋清朗相戀三年新症,在試婚紗的時候發(fā)現(xiàn)自己被綠了步氏。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,127評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡徒爹,死狀恐怖荚醒,靈堂內(nèi)的尸體忽然破棺而出芋类,到底是詐尸還是另有隱情,我是刑警寧澤界阁,帶...
    沈念sama閱讀 35,812評論 5 346
  • 正文 年R本政府宣布侯繁,位于F島的核電站,受9級特大地震影響泡躯,放射性物質(zhì)發(fā)生泄漏贮竟。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,471評論 3 331
  • 文/蒙蒙 一较剃、第九天 我趴在偏房一處隱蔽的房頂上張望咕别。 院中可真熱鬧,春花似錦写穴、人聲如沸惰拱。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽弓颈。三九已至,卻和暖如春删掀,著一層夾襖步出監(jiān)牢的瞬間翔冀,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評論 1 272
  • 我被黑心中介騙來泰國打工披泪, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留纤子,地道東北人。 一個月前我還...
    沈念sama閱讀 48,388評論 3 373
  • 正文 我出身青樓款票,卻偏偏與公主長得像控硼,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子艾少,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,066評論 2 355

推薦閱讀更多精彩內(nèi)容