論文閱讀——An Integrated Enhancement Solution for 24-hour Colorful Imaging

論文鏈接: https://arxiv.org/pdf/2005.04580.pdf

一缕陕、摘要

目前工業(yè)界對(duì)于24小時(shí)戶(hù)外成像這一課題的實(shí)踐是使用近紅外光(NIR)輔助的硅相機(jī)(silicon camera)。這種方式的缺點(diǎn)在于俘陷,白天光線(xiàn)充足時(shí)所成彩色圖像的對(duì)比度很差朗兵,夜間則缺乏色度。對(duì)于這一困境,當(dāng)前所有解決方案都是將RGB和IR圖像分開(kāi)獲取姐刁。這種方案增加了硬件開(kāi)銷(xiāo),并有可能受到場(chǎng)景限制烦味。本文提出了一種新的集成(integrated聂使,或者譯成完整的?)圖像增強(qiáng)的方法谬俄,無(wú)論白天或黑夜都能產(chǎn)生清晰彩色圖像柏靶。本文的關(guān)鍵在于從混合信號(hào)中將VIS(可見(jiàn)光譜)和NIR信息分離開(kāi),并在NIR信號(hào)的輔助下自適應(yīng)地增強(qiáng)VIS信號(hào)溃论。

當(dāng)前24小時(shí)成像方案在日/夜中的缺陷及本文的enhancement

二屎蜓、介紹與相關(guān)工作

1.1 本文貢獻(xiàn)Highlight:
  • 提出一種完備的圖像增強(qiáng)方案,用于產(chǎn)生24小時(shí)高質(zhì)量的彩色圖像
  • 設(shè)計(jì)一個(gè)成像系統(tǒng)的原型钥勋,構(gòu)建新的數(shù)據(jù)集炬转,包含aligned RAW/VIS/NIR images
  • 提出一個(gè)用于enhancement的端到端網(wǎng)絡(luò)

注:關(guān)于本文提到的integrated的解釋
Imaging under unstable illumination is the major challenge for many imaging systems. Most existing researches focus on specific cases, rather than providing an integrated 24hour colorful imaging solution.

1.2 相關(guān)背景:

以安防系統(tǒng)為代表的場(chǎng)景往往要求圖像系統(tǒng)提供穩(wěn)定而持續(xù)的24小時(shí)高質(zhì)量成像。然而周?chē)h(huán)境光照的變化對(duì)圖像質(zhì)量的影響為這一要求引入很大挑戰(zhàn)算灸,普通的相機(jī)在光線(xiàn)充足的白天成像問(wèn)題不大扼劈,但是夜晚由于光照原因,無(wú)法正常成像菲驴。為了克服夜晚光照不足對(duì)成像的影響荐吵,有以下幾種可行方案:

  1. 簡(jiǎn)單地打開(kāi)閃光燈或者增大曝光時(shí)間(提高成像時(shí)相機(jī)進(jìn)光量,注意會(huì)導(dǎo)致相機(jī)拍攝幀率降低)。這種方式并不適用:①改變成像色調(diào)及曝光范圍②導(dǎo)致成像模糊

  2. 使用近紅外補(bǔ)光來(lái)“照亮”物體捍靠,進(jìn)而獲取圖像沐旨。然而NIR的引入是一把雙刃劍:一方面NIR利用了硅傳感器在700-950nm波長(zhǎng)范圍的靈敏度,使得視覺(jué)信息可以在很暗的光線(xiàn)被獲日テ拧磁携; 另一方面NIR會(huì)影響視覺(jué)光譜(VIS)信息從而造成彩色圖像的降質(zhì)。

上述第二種方案被業(yè)界廣泛使用良风。為了解決其中的困境谊迄,一些致力于在圖像捕獲階段將VIS和NIR信息分開(kāi)的方法被提出:

  1. IR cut filter(紅外截止濾光片):當(dāng)攝像頭環(huán)境光線(xiàn)充足,切換到紅外截止濾光片烟央,此時(shí)圖像顏色非常好统诺,當(dāng)環(huán)境光線(xiàn)很暗,紅外燈開(kāi)啟疑俭,切換到全透濾光片粮呢,此時(shí)圖像為黑白清晰圖像。

  2. 使用特別定制的color filter array(濾色器陣列)钞艇,可以直接獲取VIS信號(hào)和NIR信號(hào)啄寡。但是可能需要花費(fèi)額外的精力設(shè)計(jì)類(lèi)似去馬賽克之類(lèi)的算法?可能存在圖像分辨率和質(zhì)量受限的問(wèn)題

  3. 使用兩個(gè)相機(jī)(圖像傳感器)哩照,一個(gè)獲取NIR信號(hào)挺物,另一個(gè)獲取VIS信號(hào)

方案1和3引入了額外的硬件成本。且多個(gè)傳感器之間的精確校準(zhǔn)也是一個(gè)挑戰(zhàn)飘弧。

本文方案:直接從單個(gè)普通硅相機(jī)獲取的混合信號(hào)中分離VIS和NIR信號(hào)识藤,并利用相對(duì)穩(wěn)定很多的NIR信號(hào)作為引導(dǎo)輸入,協(xié)助網(wǎng)絡(luò)對(duì)VIS信號(hào)的enhancement次伶。

能將VIS信號(hào)和NIR信號(hào)分離的理論依據(jù):硅相機(jī)在較大波長(zhǎng)范圍(300-950nm)中獲得的VIS和NIR信號(hào)痴昧,在光譜上有相對(duì)比較明顯的區(qū)分,如下圖所示:

VIS信號(hào)和NIR信號(hào)的在視覺(jué)光譜上占據(jù)的主要區(qū)間有明顯區(qū)別

三冠王、本文方法介紹

3.1 本文中推導(dǎo)的成像模型:

首先剪个,一個(gè)傳感單元的信號(hào)強(qiáng)度取決于接受(釋放)的電子數(shù)目,或者光強(qiáng)度I版确。接收到的光強(qiáng)度I則可以表示為原始入射光線(xiàn)I0(各個(gè)波長(zhǎng)范圍內(nèi)電子光譜、透射率等綜合作用的結(jié)果)加上兩種噪聲綜合的結(jié)果乎折,即:

對(duì)波長(zhǎng)范圍的積分可以近似表示為R/G/B三個(gè)離散波長(zhǎng)數(shù)值處L(λ_i)t(λ_i)q(λ_i)的累加結(jié)果绒疗,則混合成像模型可以簡(jiǎn)化為:

然后作者說(shuō)兩種噪聲可以分別用泊松分布和高斯分布來(lái)建模(雖然不知道說(shuō)這個(gè)有啥用),另外在假設(shè)Sv和Sn相互獨(dú)立的基礎(chǔ)上骂澄,可以把模型進(jìn)一步簡(jiǎn)化:

注意S_vS_u共用這一建模形式吓蘑。作者得出結(jié)論,VIS信號(hào)和NIR信號(hào)的強(qiáng)度分別取決于VIS照度水平Iv和NIR照度水平In。(感覺(jué)作者上面推那么多好像其實(shí)就是想得出這么個(gè)結(jié)論而已...感覺(jué)公式有點(diǎn)強(qiáng)行)

3.2 本文貢獻(xiàn)的VIS-NIR-MIX(VNM)數(shù)據(jù)集

作者根據(jù)上面的分析磨镶,提到由于VIS信號(hào)照度水平在一天之內(nèi)變化會(huì)比較大溃蔫,導(dǎo)致Sv也會(huì)產(chǎn)生劇烈變化。當(dāng)Iv不充分時(shí)Sv的信噪比會(huì)很低琳猫。而In就不存在該問(wèn)題伟叛,由于額外的NIR補(bǔ)光存在,NIR在一天之內(nèi)可以保持非常穩(wěn)定且充足的照度水平脐嫂,故NIR的信號(hào)強(qiáng)度也非常穩(wěn)定统刮,信噪比較高≌饲В基于這些事實(shí)侥蒙,作者設(shè)計(jì)了采集數(shù)據(jù)的方案:

采集目標(biāo):①采集白天和夜晚的NIR-VIS帶噪聲混合數(shù)據(jù),作為模型輸入匀奏;②采集白天和夜晚的NIR/VIS兩種數(shù)據(jù)鞭衩,用來(lái)訓(xùn)練SeperationNet,將mixed image分開(kāi)娃善;③采集高質(zhì)量的VIS數(shù)據(jù)论衍,用于訓(xùn)練RestorationNet與ColorizationNet(如果夜晚采集可以通過(guò)long exposure實(shí)現(xiàn))

數(shù)據(jù)采集設(shè)備

每個(gè)場(chǎng)景采集7張圖像:

VNM數(shù)據(jù)集構(gòu)成示意
3.3 模型架構(gòu)與Loss設(shè)置:
本文的Speration和Restoration模型整體結(jié)構(gòu)

整體來(lái)說(shuō)模型結(jié)構(gòu)比較粗暴,各個(gè)模塊都由一個(gè)Unet的子網(wǎng)絡(luò)構(gòu)成会放。具體來(lái)說(shuō)分為四個(gè)sub-Unet:

  1. SeperationNet:輸入為mix圖像饲齐,label為NIR圖像。用于從原始信號(hào)分離NIR信號(hào)咧最;

  2. PropotionNet:輸入為mix圖像捂人,沒(méi)有直接label,預(yù)測(cè)出一個(gè)deviation prob map矢沿,然后讓mix image - prob_map * NIR圖像滥搭,得到VIS圖像,對(duì)預(yù)測(cè)的VIS圖像做監(jiān)督捣鲸。
    這里作者的解釋是瑟匆,在采集NIR數(shù)據(jù)(比如,用一個(gè)700-850nm波長(zhǎng)段的濾波器)時(shí)栽惶,由于該波長(zhǎng)段除了NIR信號(hào)其實(shí)也包含部分VIS信號(hào)(見(jiàn)下圖)愁溜,實(shí)際上采集到的“NIR信號(hào)”也是一種混合信號(hào),只不過(guò)可能NIR信號(hào)在其中所占據(jù)比例比較大外厂。故可以先讓模型預(yù)測(cè)出“混合NIR信號(hào)”中純凈NIR信號(hào)的占比冕象,然后通過(guò)乘以這個(gè)prob map得到純凈NIR信號(hào),再用輸入的mix信號(hào)減去純凈NIR信號(hào)汁蝶,即得到了分離出的純凈VIS信號(hào)(或者是帶噪聲的VIS信號(hào)渐扮,但是不包含NIR信號(hào)论悴?按作者的意思,純凈VIS信號(hào)+純凈NIR信號(hào)應(yīng)該是等于無(wú)噪聲的mix信號(hào))墓律。

  3. RestorationNet:輸入為NIR信號(hào)+分離的VIS信號(hào)的Y通道(lumination component)膀估,預(yù)測(cè)出enhanced VIS-Y,label應(yīng)該是高質(zhì)量的VIS圖像的Y通道耻讽;

  4. ColorizationNet:輸入為分離的VIS信號(hào)的UV通道察纯,預(yù)測(cè)出enhanced VIS-UV通道(chrominance component),該sub net沒(méi)有直接監(jiān)督齐饮,而是將enhanced VIS-Y和enhanced VIS-UV堆疊起來(lái)轉(zhuǎn)換為RGB之后捐寥,使用高質(zhì)量的VIS RGB label做監(jiān)督。值得注意的是作者在預(yù)測(cè)VIS-UV時(shí)并沒(méi)有將預(yù)測(cè)結(jié)果上采樣到原圖大小祖驱,而是上采樣到原分辨率的1/4握恳,YUV合并前再resize回去。這里作者解釋說(shuō)是瓭色彩信息相比亮度intensity信息捺僻,在空間頻率上低一些乡洼,故一定程度的壓縮可能不影響視覺(jué)感受,但是對(duì)于denoising和enhancement會(huì)有好處(為什么匕坯?)束昵。

Loss函數(shù):

  1. 對(duì)于Seperation部分,L^{v}代表VIS的損失葛峻,L^n代表NIR的損失锹雏,L_{ma}代表MAE,L_{SS}代表SSIM术奖,這里用1-SSIM(I_{in},I_{out})來(lái)對(duì)輸入輸出之間的結(jié)構(gòu)一致性做一個(gè)監(jiān)督礁遵。L_{sm}代表一個(gè)結(jié)構(gòu)上的平滑約束項(xiàng),這里沒(méi)太看懂

  2. 對(duì)于Restoration部分采记,v2和y分別代表高質(zhì)量VIS的RGB形式和Y分量(感覺(jué)符號(hào)表示的比較奇怪)佣耐,最后一項(xiàng)L_{pe}代表會(huì)對(duì)預(yù)測(cè)的RGB和GT RGB做一個(gè)percepual loss,以進(jìn)一步提升重建圖像的高層信息一致性唧龄。

四兼砖、信息記錄

4.1 名詞解釋?zhuān)?/h5>
  • CFA:color filter array與Bayer Filter
背景:

物體反射的光線(xiàn)被相機(jī)的光電傳感器接收到,但是光電傳感器只能感覺(jué)到intensity信息既棺,對(duì)光的波長(zhǎng)信息沒(méi)有分辨力讽挟。所以無(wú)法分辨顏色信息。為了要分辨顏色信息丸冕,需要分別用R/G/B對(duì)應(yīng)波長(zhǎng)段的濾鏡來(lái)過(guò)濾入射光并接收耽梅,以獲取R/G/B三個(gè)通道。但是這種方式使得相機(jī)中的傳感元件體積很大晨仑,成本很高。拜耳過(guò)濾器的出現(xiàn)解決了這一問(wèn)題。

成像過(guò)程:
  1. 首先拜耳過(guò)濾器被放置于像素傳感器上方洪己,一個(gè)顏色對(duì)應(yīng)一個(gè)像素妥凳,即每個(gè)重復(fù)的模式占據(jù)四個(gè)像素傳感器單元。

    拜耳過(guò)濾器與像素傳感器的關(guān)系
  2. 經(jīng)過(guò)上述濾色器陣列-像素傳感器組成的成像元件之后答捕,生成原始數(shù)據(jù):每個(gè)像素只有R/G/B中的一個(gè)顏色逝钥,丟失的兩種顏色需要通過(guò)去馬賽克算法來(lái)估計(jì)出來(lái)

Mosaiced raw data示意圖
與3-sensor相機(jī)的比較:



  • 白平衡:
4.2 不理解的地方記錄
  1. 本文貢獻(xiàn)的數(shù)據(jù)集和代碼都未公開(kāi)?
  2. 模型訓(xùn)練時(shí)拱镐,輸入是白天/夜晚的mix圖像艘款,SeperationNet的label是通過(guò)NIR pass filter和VIS pass filter得到的NIR和VIS信號(hào)。那么 RestorationNet的label是什么沃琅?L^y_{ma}用的應(yīng)該是long exposure的VIS信號(hào)的Y分量哗咆,L^{v2}_{ma}用的是VIS信號(hào)的RGB形式?那如果訓(xùn)白天數(shù)據(jù)的話(huà)益眉,SeperationNet的VISlabel和RestorationNet的VIS-Y label及VIS-RGB label是不是同一張圖像對(duì)應(yīng)的晌柬?論文講的不太清楚。
  3. 夜晚采集的NIR數(shù)據(jù)有用嗎郭脂?文章中說(shuō)白天采集的VIS和NIR數(shù)據(jù)由于SNR比較大可以忽略噪年碘;同時(shí)NIR信號(hào)強(qiáng)度在白天和晚上變化不大,那是不是對(duì)同一個(gè)場(chǎng)景展鸡,SeperationNet都應(yīng)該用白天的NIR數(shù)據(jù)屿衅?
  4. 公式9中這個(gè)形式為什么可以描述輸入圖像和輸出圖像的structure-awareness?并不是一個(gè)歸一化的指標(biāo)莹弊?
  5. 數(shù)據(jù)采集階段的LED simulation是做什么的涤久?
  6. 在ColorizationNet預(yù)測(cè)UV分量時(shí)作者提到由于相對(duì)空間頻率低一些可以容忍一定程度壓縮,故預(yù)測(cè)的分辨率比原土低箱硕,作者還說(shuō)這樣便于去噪和enhancement拴竹,為什么?
4.3 相關(guān)詞匯記錄:
  • to this end: 為此
  • surveillance systems:監(jiān)控系統(tǒng)
  • ambient: 周?chē)木缯郑h(huán)境的
  • superposition:疊加
  • meticulous calibration:精細(xì)校準(zhǔn)
4.4 參考文獻(xiàn)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末栓拜,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子惠昔,更是在濱河造成了極大的恐慌幕与,老刑警劉巖,帶你破解...
    沈念sama閱讀 207,248評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件镇防,死亡現(xiàn)場(chǎng)離奇詭異啦鸣,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)来氧,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,681評(píng)論 2 381
  • 文/潘曉璐 我一進(jìn)店門(mén)诫给,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)香拉,“玉大人,你說(shuō)我怎么就攤上這事中狂≠炻担” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 153,443評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵胃榕,是天一觀(guān)的道長(zhǎng)盛险。 經(jīng)常有香客問(wèn)我,道長(zhǎng)勋又,這世上最難降的妖魔是什么苦掘? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,475評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮楔壤,結(jié)果婚禮上鹤啡,老公的妹妹穿的比我還像新娘。我一直安慰自己挺邀,他們只是感情好揉忘,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,458評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著端铛,像睡著了一般泣矛。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上禾蚕,一...
    開(kāi)封第一講書(shū)人閱讀 49,185評(píng)論 1 284
  • 那天您朽,我揣著相機(jī)與錄音,去河邊找鬼换淆。 笑死哗总,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的倍试。 我是一名探鬼主播讯屈,決...
    沈念sama閱讀 38,451評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼县习!你這毒婦竟也來(lái)了涮母?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,112評(píng)論 0 261
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤躁愿,失蹤者是張志新(化名)和其女友劉穎叛本,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體彤钟,經(jīng)...
    沈念sama閱讀 43,609評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡来候,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,083評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了逸雹。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片营搅。...
    茶點(diǎn)故事閱讀 38,163評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡云挟,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出转质,到底是詐尸還是另有隱情植锉,我是刑警寧澤,帶...
    沈念sama閱讀 33,803評(píng)論 4 323
  • 正文 年R本政府宣布峭拘,位于F島的核電站,受9級(jí)特大地震影響狮暑,放射性物質(zhì)發(fā)生泄漏鸡挠。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,357評(píng)論 3 307
  • 文/蒙蒙 一搬男、第九天 我趴在偏房一處隱蔽的房頂上張望拣展。 院中可真熱鬧,春花似錦缔逛、人聲如沸备埃。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,357評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)按脚。三九已至,卻和暖如春敦冬,著一層夾襖步出監(jiān)牢的瞬間辅搬,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,590評(píng)論 1 261
  • 我被黑心中介騙來(lái)泰國(guó)打工脖旱, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留堪遂,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,636評(píng)論 2 355
  • 正文 我出身青樓萌庆,卻偏偏與公主長(zhǎng)得像溶褪,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子践险,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,925評(píng)論 2 344