視頻編碼標(biāo)準(zhǔn)化組織
在國(guó)際組織的獨(dú)立和聯(lián)合開發(fā)中沧烈,產(chǎn)生了很多重要的視頻編解碼標(biāo)準(zhǔn)掠兄。主要國(guó)際組織包括ISO/IEC MPEG、ITU-T锌雀、Google蚂夕、Microsoft、AVS工作組和AOM聯(lián)盟等腋逆。
ITU-T婿牍,全稱International Telecommunications Union - Telecommunication Standardization Sector,即國(guó)際電信聯(lián)盟——電信標(biāo)準(zhǔn)分局惩歉。該組織下設(shè)的VECG(Video Coding Experts Group)主要負(fù)責(zé)面向?qū)崟r(shí)通信領(lǐng)域的標(biāo)準(zhǔn)制定等脂,主要制定了H.261/H263/H263+/H263++等標(biāo)準(zhǔn)。
ISO撑蚌,全稱International Standards Organization上遥,即國(guó)際標(biāo)準(zhǔn)化組織。該組織下屬的MPEG(Motion Picture Experts Group)争涌,即移動(dòng)圖像專家組主要負(fù)責(zé)面向視頻存儲(chǔ)粉楚、廣播電視、網(wǎng)絡(luò)傳輸?shù)囊曨l標(biāo)準(zhǔn)亮垫,主要制定了MPEG-1/MPEG-4等解幼。
實(shí)際上,真正在業(yè)界產(chǎn)生較強(qiáng)影響力的標(biāo)準(zhǔn)均是由兩個(gè)組織合作產(chǎn)生的包警。比如MPEG-2、H.264/AVC和H.265/HEVC等底靠。
主要標(biāo)準(zhǔn)包括:JPEG害晦、MJPEG、JPEG2000、H.261壹瘟、MPEG-1鲫剿、H.262/MPEG-2、H.263稻轨、MPEG-4 (Part2/ASP)灵莲、H.264/MPEG-4 (Part10/AVC)、H.265/MPEG-H (Part2/HEVC)殴俱、H.266/VVC政冻、VP8/VP9、AV1线欲、AVS1/AVS2明场、SVAC1/SVAC2等。
主要視頻編碼標(biāo)準(zhǔn)介紹
1. JPEG
JPEG 是Joint Photographic Experts Group(聯(lián)合圖像專家小組)的縮寫李丰,是第一個(gè)國(guó)際圖像壓縮標(biāo)準(zhǔn)苦锨。JPEG圖像壓縮算法能夠在提供良好的壓縮性能的同時(shí),具有比較好的重建質(zhì)量趴泌,被廣泛應(yīng)用于圖像舟舒、視頻處理領(lǐng)域。
2. MJPEG
M-JPEG(Motion- Join Photographic Experts Group)技術(shù)即運(yùn)動(dòng)靜止圖像(或逐幀)壓縮技術(shù)嗜憔,廣泛應(yīng)用于非線性編輯領(lǐng)域可精確到幀編輯和多層圖像處理秃励,把運(yùn)動(dòng)的視頻序列作為連續(xù)的靜止圖像來處理,這種壓縮方式單獨(dú)完整地壓縮每一幀痹筛,在編輯過程中可隨機(jī)存儲(chǔ)每一幀莺治,可進(jìn)行精確到幀的編輯,此外M-JPEG的壓縮和解壓縮是對(duì)稱的帚稠,可由相同的硬件和軟件實(shí)現(xiàn)谣旁。但M-JPEG只對(duì)幀內(nèi)的空間冗余進(jìn)行壓縮。不對(duì)幀間的時(shí)間冗余進(jìn)行壓縮滋早,故壓縮效率不高榄审。采用M-JPEG數(shù)字壓縮格式,當(dāng)壓縮比7:1時(shí)杆麸,可提供相當(dāng)于Betecam SP質(zhì)量圖像的節(jié)目搁进。
JPEG標(biāo)準(zhǔn)所根據(jù)的算法是基于DCT(離散余弦變換)和可變長(zhǎng)編碼。JPEG的關(guān)鍵技術(shù)有變換編碼昔头、量化饼问、差分編碼、運(yùn)動(dòng)補(bǔ)償揭斧、霍夫曼編碼和游程編碼等
M-JPEG的優(yōu)點(diǎn)是:可以很容易做到精確到幀的編輯莱革、設(shè)備比較成熟。缺點(diǎn)是壓縮效率不高。
此外盅视,M-JPEG這種壓縮方式并不是一個(gè)完全統(tǒng)一的壓縮標(biāo)準(zhǔn)捐名,不同廠家的編解碼器和存儲(chǔ)方式并沒有統(tǒng)一的規(guī)定格式。這也就是說闹击,每個(gè)型號(hào)的視頻服務(wù)器或編碼板有自己的M-JPEG版本镶蹋,所以在服務(wù)器之間的數(shù)據(jù)傳輸、非線性制作網(wǎng)絡(luò)向服務(wù)器的數(shù)據(jù)傳輸都根本是不可能的赏半。
3. JPEG2000
JPEG 2000 (JP2) is an image compression standard and coding system. It was created by the Joint Photographic Experts Group committee in 2000 with the intention of superseding their original discrete cosine transform-based JPEG standard (created in 1992) with a newly designed, wavelet-based method. The standardized filename extension is .jp2 for ISO/IEC 15444-1 conforming files and .jpx for the extended part-2 specifications, published as ISO/IEC 15444-2. The registered MIME types are defined in RFC 3745. For ISO/IEC 15444-1 it is image/jp2.
4. H.261
H.261視頻編碼標(biāo)準(zhǔn)誕生于1988年贺归,可謂是視頻壓縮編碼發(fā)展的第一個(gè)里程碑。因?yàn)閺腍.261開始除破,視頻編碼方法采用了沿用至今的基于波形的混合編碼方法牧氮。H.261標(biāo)準(zhǔn)主要目標(biāo)是用于視頻會(huì)議和可視電話等高實(shí)時(shí)性、低碼率的視頻圖像傳輸場(chǎng)合瑰枫。
在H.261標(biāo)準(zhǔn)產(chǎn)生的時(shí)代踱葛,由于各國(guó)的電視制式不一致,因此不能直接互通光坝。為了解決數(shù)據(jù)源格式不兼容的問題尸诽,H.261定義了一種公共中間格式CIF(Common Intermediate Format)。編碼的目標(biāo)格式首選轉(zhuǎn)換為CIF格式進(jìn)行編碼和傳輸盯另,接收端進(jìn)行解碼后再轉(zhuǎn)換為各自的格式性含。H.261規(guī)定的CIF格式視頻的亮度分辨率為352×288,QCIF格式的亮度分辨率為176×144鸳惯。
H.261信源編碼所采用的技術(shù):
幀內(nèi)編碼/幀間編碼判定:根據(jù)幀與幀之間的相關(guān)性判定——相關(guān)性高使用幀間編碼商蕴,相關(guān)性低使用幀內(nèi)編碼。
幀內(nèi)編碼:對(duì)于幀內(nèi)編碼幀芝发,直接使用DCT編碼8×8的像素塊绪商。
幀間編碼/運(yùn)動(dòng)估計(jì):使用以宏塊為基礎(chǔ)的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)編碼;當(dāng)前宏塊從參考幀中查找最佳匹配宏塊辅鲸,并計(jì)算其相對(duì)偏移量(Vx, Vy)作為運(yùn)動(dòng)矢量格郁;編碼器使用DCT、量化編碼當(dāng)前宏塊和預(yù)測(cè)宏塊的殘差信號(hào)独悴;幀間編碼/運(yùn)動(dòng)估計(jì):使用以宏塊為基礎(chǔ)的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)編碼例书;當(dāng)前宏塊從參考幀中查找最佳匹配宏塊,并計(jì)算其相對(duì)偏移量(Vx, Vy)作為運(yùn)動(dòng)矢量刻炒;編碼器使用DCT决采、量化編碼當(dāng)前宏塊和預(yù)測(cè)宏塊的殘差信號(hào);
環(huán)路濾波器:實(shí)際上是一個(gè)數(shù)字低通濾波器坟奥,濾除不必要的高頻信息树瞭,以消除方塊效應(yīng)暂幼;環(huán)路濾波器:實(shí)際上是一個(gè)數(shù)字低通濾波器,濾除不必要的高頻信息移迫,以消除方塊效應(yīng);
5. MPEG-1
MPEG-1標(biāo)準(zhǔn)于1993年8月公布管行,用于傳輸1.5Mbps數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像及其伴音的編碼厨埋。該標(biāo)準(zhǔn)包括五個(gè)部分:
第一部分說明了如何根據(jù)第二部分(視頻)以及第三部分(音頻)的規(guī)定,對(duì)音頻和視頻進(jìn)行復(fù)合編碼梢卸。第四部分說明了檢驗(yàn)解碼器或編碼器的輸出比特流符合前三部分規(guī)定的過程巫延。第五部分是一個(gè)用完整的C語言實(shí)現(xiàn)的編碼和解碼器狡恬。
該標(biāo)準(zhǔn)從頒布的那一刻起,MPEG-1取得一連串的成功废赞,如VCD和MP3的大量使用,Windows95以后的版本都帶有一個(gè)MPEG-1軟件解碼器叮姑,可攜式MPEG-1攝像機(jī)等等唉地。
6. MPEG-2/H.262
MPEG組織于1994年推出MPEG-2壓縮標(biāo)準(zhǔn),以實(shí)現(xiàn)視/音頻服務(wù)與應(yīng)用互操作的可能性传透≡耪樱 MPEG-2標(biāo)準(zhǔn)是針對(duì)標(biāo)準(zhǔn)數(shù)字電視和高清晰度電視在各種應(yīng)用下的壓縮方案和系統(tǒng)層的詳細(xì)規(guī)定,編碼碼率從每秒3兆比特~100兆比特朱盐,標(biāo)準(zhǔn)的正式規(guī)范在ISO/IEC13818中群嗤。MPEG-2不是MPEG-1的簡(jiǎn)單升級(jí),MPEG-2在系統(tǒng)和傳送方面作了更加詳細(xì)的規(guī)定和進(jìn)一步的完善兵琳。MPEG-2特別適用于廣播級(jí)的數(shù)字電視的編碼和傳送狂秘,被認(rèn)定為SDTV和HDTV的編碼標(biāo)準(zhǔn)。
MPEG-2圖像壓縮的原理是利用了圖像中的兩種特性:空間相關(guān)性和時(shí)間相關(guān)性躯肌。這兩種相關(guān)性使得圖像中存在大量的冗余信息者春。如果我們能將這些冗余信息去除,只保留少量非相關(guān)信息進(jìn)行傳輸羡榴,就可以大大節(jié)省傳輸頻帶碧查。而接收機(jī)利用這些非相關(guān)信息,按照一定的解碼算法校仑,可以在保證一定的圖像質(zhì)量的前提下恢復(fù)原始圖像忠售。一個(gè)好的壓縮編碼方案就是能夠最大限度地去除圖像中的冗余信息。
MPEG-2的編碼圖像被分為三類迄沫,分別稱為I幀稻扬,P幀和B幀。 I幀圖像采用幀內(nèi)編碼方式羊瘩,即只利用了單幀圖像內(nèi)的空間相關(guān)性泰佳,而沒有利用時(shí)間相關(guān)性盼砍。P幀和B幀圖像采用幀間編碼方式,即同時(shí)利用了空間和時(shí)間上的相關(guān)性逝她。P幀圖像只采用前向時(shí)間預(yù)測(cè)浇坐,可以提高壓縮效率和圖像質(zhì)量。P幀圖像中可以包含幀內(nèi)編碼的部分黔宛,即P幀中的每一個(gè)宏塊可以是前向預(yù)測(cè)近刘,也可以是幀內(nèi)編碼。B幀圖像采用雙向時(shí)間預(yù)測(cè)臀晃,可以大大提高壓縮倍數(shù)觉渴。
MPEG-2的編碼碼流分為六個(gè)層次。為更好地表示編碼數(shù)據(jù)徽惋,MPEG-2用句法規(guī)定了一個(gè)層次性結(jié)構(gòu)案淋。它分為六層,自上到下分別是:圖像序列層险绘、圖像組(GOP)踢京、圖像、宏塊條隆圆、宏塊漱挚、塊。
7. H.263
H.263是國(guó)際電聯(lián)ITU-T的一個(gè)標(biāo)準(zhǔn)草案渺氧,是為低碼流通信而設(shè)計(jì)的旨涝。但實(shí)際上這個(gè)標(biāo)準(zhǔn)可用在很寬的碼流范圍,而非只用于低碼流應(yīng)用侣背,它在許多應(yīng)用中可以認(rèn)為被用于取代H.261白华。H.263的編碼算法與H.261一樣,但做了一些改善和改變贩耐,以提高性能和糾錯(cuò)能力弧腥。.263標(biāo)準(zhǔn)在低碼率下能夠提供比H.261更好的圖像效果,兩者的區(qū)別有:(1)H.263的運(yùn)動(dòng)補(bǔ)償使用半象素精度潮太,而H.261則用全象素精度和循環(huán)濾波管搪;(2)數(shù)據(jù)流層次結(jié)構(gòu)的某些部分在H.263中是可選的,使得編解碼可以配置成更低的數(shù)據(jù)率或更好的糾錯(cuò)能力铡买;(3)H.263包含四個(gè)可協(xié)商的選項(xiàng)以改善性能更鲁;(4)H.263采用無限制的運(yùn)動(dòng)向量以及基于語法的算術(shù)編碼;(5)采用事先預(yù)測(cè)和與MPEG中的P-B幀一樣的幀預(yù)測(cè)方法奇钞;(6)H.263支持5種分辨率澡为,即除了支持H.261中所支持的QCIF和CIF外,還支持SQCIF景埃、4CIF和16CIF媒至,SQCIF相當(dāng)于QCIF一半的分辨率顶别,而4CIF和16CIF分別為CIF的4倍和16倍。
1998年IUT-T推出的H.263+是H.263建議的第2版拒啰,它提供了12個(gè)新的可協(xié)商模式和其他特征驯绎,進(jìn)一步提高了壓縮編碼性能。如H.263只有5種視頻源格式谋旦,H.263+允許使用更多的源格式条篷,圖像時(shí)鐘頻率也有多種選擇,拓寬應(yīng)用范圍蛤织;另一重要的改進(jìn)是可擴(kuò)展性,它允許多顯示率鸿染、多速率及多分辨率指蚜,增強(qiáng)了視頻信息在易誤碼、易丟包異構(gòu)網(wǎng)絡(luò)環(huán)境下的傳輸涨椒。另外摊鸡,H.263+對(duì)H.263中的不受限運(yùn)動(dòng)矢量模式進(jìn)行了改進(jìn),加上12個(gè)新增的可選模式蚕冬,不僅提高了編碼性能免猾,而且增強(qiáng)了應(yīng)用的靈活性。H.263已經(jīng)基本上取代了H.261囤热。
8. MPEG-4 (Part2/ASP)
運(yùn)動(dòng)圖像專家組MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)標(biāo)準(zhǔn)第一版本猎提。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成為國(guó)際標(biāo)準(zhǔn)旁蔼。
MPEG-4與MPEG-1和MPEG-2有很大的不同锨苏。MPEG-4不只是具體壓縮算法,它是針對(duì)數(shù)字電視棺聊、交互式繪圖應(yīng)用(影音合成內(nèi)容)伞租、交互式多媒體(WWW、資料擷取與分散)等整合及壓縮技術(shù)的需求而制定的國(guó)際標(biāo)準(zhǔn)限佩。MPEG-4標(biāo)準(zhǔn)將眾多的多媒體應(yīng)用集成于一個(gè)完整的框架內(nèi)葵诈,旨在為多媒體通信及應(yīng)用環(huán)境提供標(biāo)準(zhǔn)的算法及工具,從而建立起一種能被多媒體傳輸祟同、存儲(chǔ)作喘、檢索等應(yīng)用領(lǐng)域普遍采用的統(tǒng)一數(shù)據(jù)格式。
9. H.264/MPEG4 (Part10 AVC)
H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT)制定的新一代視頻壓縮編碼標(biāo)準(zhǔn)耐亏。在ISO/IEC中該標(biāo)準(zhǔn)命名為AVC (Advanced Video Coding)徊都,作為MPEG-4標(biāo)準(zhǔn)的第10個(gè)選項(xiàng);在ITU-T中正式命名為H.264標(biāo)準(zhǔn)广辰。
10. H.265/HEVC
H.265是ITU-T VCEG 繼H.264之后所制定的新的視頻編碼標(biāo)準(zhǔn)暇矫。H.265標(biāo)準(zhǔn)圍繞著現(xiàn)有的視頻編碼標(biāo)準(zhǔn)H.264主之,保留原來的某些技術(shù),同時(shí)對(duì)一些相關(guān)的技術(shù)加以改進(jìn)李根。新技術(shù)使用先進(jìn)的技術(shù)用以改善碼流槽奕、編碼質(zhì)量、延時(shí)和算法復(fù)雜度之間的關(guān)系房轿,達(dá)到最優(yōu)化設(shè)置粤攒。具體的研究?jī)?nèi)容包括:提高壓縮效率、提高魯棒性和錯(cuò)誤恢復(fù)能力囱持、減少實(shí)時(shí)的時(shí)延夯接、減少信道獲取時(shí)間和隨機(jī)接入時(shí)延、降低復(fù)雜度等纷妆。H264由于算法優(yōu)化盔几,可以低于1Mbps的速度實(shí)現(xiàn)標(biāo)清數(shù)字圖像傳送;H265則可以實(shí)現(xiàn)利用1~2Mbps的傳輸速度傳送720P(分辨率1280*720)普通高清音視頻傳送。