全面超越JPEG2000——一種端到端的圖像壓縮方法

作者:黃建義 ? ?組別:研0組

【嵌牛導(dǎo)讀】:數(shù)據(jù)壓縮是一種基礎(chǔ)工程問(wèn)題缺厉,在數(shù)據(jù)存儲(chǔ)和有限容量信道傳輸中有重要的應(yīng)用础浮。圖像作為一種信息載體恨豁,數(shù)據(jù)量巨大嘀粱,因此研究者們對(duì)圖像壓縮的研究從未停止過(guò)激挪。端到端優(yōu)化的圖像壓縮方法通常比標(biāo)準(zhǔn)JPEG和JPEG 2000壓縮方法有更好的rate-distortion性能辰狡,并顯著提升了壓縮后圖片的視覺(jué)效果。

嵌牛鼻子】:End-to-End Optimized Image Compression(端到端優(yōu)化的圖像壓縮)

【嵌牛正文】:數(shù)據(jù)壓縮是一種被充分研究的基礎(chǔ)工程問(wèn)題垄分,通常是為具有最小熵的給定離散數(shù)據(jù)集設(shè)計(jì)編碼宛篇。解決方案很大程度上依賴于數(shù)據(jù)概率結(jié)構(gòu)的知識(shí),因此問(wèn)題與概率源建模密切相關(guān)薄湿。然而叫倍,由于所有的實(shí)際編碼一定具有有限的熵,連續(xù)值的數(shù)據(jù)(例如圖像像素強(qiáng)度的向量)必須被量化為離散的值豺瘤,這就會(huì)導(dǎo)致誤差吆倦。在有損壓縮問(wèn)題下,必須權(quán)衡兩種損失:離散化表示的熵(rate炉奴,壓縮率)和量化導(dǎo)致的誤差(distortion逼庞,失真)。不同的壓縮應(yīng)用場(chǎng)景瞻赶,比如數(shù)據(jù)存儲(chǔ)或者有限容量信道傳輸,需要不同的壓縮率與失真的權(quán)衡派任。

? ? ? ? 同時(shí)優(yōu)化壓縮率和失真是困難的砸逊。在沒(méi)有額外的約束的情況下,在高維空間進(jìn)行最優(yōu)量化是很棘手的掌逛。由于這個(gè)原因师逸,目前大多數(shù)的圖像壓縮方法將數(shù)據(jù)向量線性的變換成適當(dāng)?shù)倪B續(xù)值表示,獨(dú)立量化各個(gè)元素豆混,然后使用無(wú)損熵編碼對(duì)所得到的離散表示進(jìn)行編碼篓像。,由于變換起到的至關(guān)重要的作用皿伺,這種方法被稱為變換編碼(transform coding)例如JPEG在分塊像素上使用了離散余弦變換员辩,JPEG 2000使用了多種尺度的正交小波分解。

? ? ? 在ICLR 2017會(huì)議上鸵鸥,來(lái)自紐約大學(xué)的Johannes Balle等研究者提出了一種端到端優(yōu)化的圖像壓縮方法奠滑,并發(fā)表了論文:《End-to-End Optimized Image Compression》。這種方法包含了三個(gè)過(guò)程妒穴,分別是:非線性分析變換宋税,均勻量化器,以及非線性合成變換讼油。它是一種通用的非線性變換編碼架構(gòu)杰赛。一個(gè)圖像向量x,通過(guò)一個(gè)參數(shù)化的分析變換y=ga(x矮台;Φ)乏屯,映射到編碼空間(code space)中根时。這個(gè)表示被量化,產(chǎn)生一個(gè)離散值的向量q瓶珊,接下來(lái)q被壓縮啸箫。而重建壓縮圖像則與之相反。對(duì)于其中的分析變換伞芹,研究人員使用了基于級(jí)聯(lián)的線性卷積層和非線性層的更靈活的變換忘苛,來(lái)優(yōu)化均方誤差(mean squared error,MSE)唱较。值得注意的是扎唾,研究者使用了generalized divisive normalization(GND)聯(lián)合非線性層,這對(duì)高斯圖像密度是很有效的南缓,這是由生物視覺(jué)系統(tǒng)神經(jīng)元所啟發(fā)的胸遇。

圖一、端到端優(yōu)化的圖片壓縮框架

? ? ? ? 論文中汉形,研究人員將他們的方法與兩個(gè)標(biāo)準(zhǔn)方法 JPEG 和 JPEG 2000 進(jìn)行對(duì)比纸镊。得到結(jié)果如下:

圖二、壓縮后圖片對(duì)比圖

? ? ? ? ? ?下面是上圖圖像亮度分量的rate-distortion曲線概疆,左側(cè)是感知質(zhì)量逗威,由多尺度結(jié)構(gòu)相似性度量(MS-SSIM)。右側(cè)是峰值信噪比岔冀。

圖三凯旭、圖像亮度分量的rate-distortion曲線

? ? ? ?下圖為三種比特率下的圖像壓縮。從上到下分別是JPEG使套,論文中的方法罐呼,JPEG 2000,從左到右侦高,比特率一步步增大嫉柴。

圖四、壓縮對(duì)比圖

? ? ? ? 論文中的方法相較于未壓縮的原圖細(xì)節(jié)較少矫膨,細(xì)節(jié)紋理和圖案大部分被消除了差凹,但是保留了輪廓的平滑性以及邊緣的銳度,使得圖像擁有自然的感觀侧馅。相比之下危尿,JPEG和JPEG 2000有明顯的人工痕跡,這也是所有線性變換編碼方法的問(wèn)題:由于局部特征(邊緣馁痴,輪廓谊娇,紋理元素等)是由局部線性基函數(shù)的組合表示的,變換系數(shù)的獨(dú)立標(biāo)量量化導(dǎo)致這些組合不平衡,導(dǎo)致在視覺(jué)上反映出潛在的基函數(shù)济欢,即圖像混疊和振鈴現(xiàn)象赠堵。

? ? ? ?值得注意的是,該論文中的方法在所有測(cè)試圖像和所有比特率上法褥,都有可察覺(jué)的優(yōu)勢(shì)茫叭。上圖中顯示了從高到低比特率的過(guò)程。隨著比特率的降低半等,JPEG和JPEG 2000通過(guò)粗化線性基函數(shù)系數(shù)的精度來(lái)降低其對(duì)原始圖像的近似揍愁,因此暴露出這些基函數(shù)的視覺(jué)上的外觀。另一方面杀饵,論文中的方法逐漸簡(jiǎn)化了輪廓和其他圖像特征莽囤,有效隱藏了表示底層的量化。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末切距,一起剝皮案震驚了整個(gè)濱河市朽缎,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌谜悟,老刑警劉巖话肖,帶你破解...
    沈念sama閱讀 216,591評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異葡幸,居然都是意外死亡狼牺,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,448評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門礼患,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人掠归,你說(shuō)我怎么就攤上這事缅叠。” “怎么了虏冻?”我有些...
    開封第一講書人閱讀 162,823評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵肤粱,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我厨相,道長(zhǎng)领曼,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,204評(píng)論 1 292
  • 正文 為了忘掉前任蛮穿,我火速辦了婚禮庶骄,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘践磅。我一直安慰自己单刁,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,228評(píng)論 6 388
  • 文/花漫 我一把揭開白布府适。 她就那樣靜靜地躺著羔飞,像睡著了一般肺樟。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上逻淌,一...
    開封第一講書人閱讀 51,190評(píng)論 1 299
  • 那天么伯,我揣著相機(jī)與錄音,去河邊找鬼卡儒。 笑死田柔,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的朋贬。 我是一名探鬼主播凯楔,決...
    沈念sama閱讀 40,078評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼锦募!你這毒婦竟也來(lái)了摆屯?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,923評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤糠亩,失蹤者是張志新(化名)和其女友劉穎虐骑,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體赎线,經(jīng)...
    沈念sama閱讀 45,334評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡廷没,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,550評(píng)論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了垂寥。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片颠黎。...
    茶點(diǎn)故事閱讀 39,727評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖滞项,靈堂內(nèi)的尸體忽然破棺而出狭归,到底是詐尸還是另有隱情,我是刑警寧澤文判,帶...
    沈念sama閱讀 35,428評(píng)論 5 343
  • 正文 年R本政府宣布过椎,位于F島的核電站,受9級(jí)特大地震影響戏仓,放射性物質(zhì)發(fā)生泄漏疚宇。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,022評(píng)論 3 326
  • 文/蒙蒙 一赏殃、第九天 我趴在偏房一處隱蔽的房頂上張望敷待。 院中可真熱鬧,春花似錦嗓奢、人聲如沸讼撒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,672評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)根盒。三九已至钳幅,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間炎滞,已是汗流浹背敢艰。 一陣腳步聲響...
    開封第一講書人閱讀 32,826評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留册赛,地道東北人钠导。 一個(gè)月前我還...
    沈念sama閱讀 47,734評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像森瘪,于是被迫代替她去往敵國(guó)和親牡属。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,619評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容