Vid2Vid:Video-to-Video Synthesis

論文:Vid2Vid
代碼:項目主頁
Vid2Vid作為pix2pix浅妆,pix2pixHD的改進(jìn)版本煤率,重點解決了視頻到視頻轉(zhuǎn)換過程中的前后幀不一致性問題。

視頻生成的難點

GAN在圖像生成領(lǐng)域雖然研究十分廣泛,然而在視頻生成領(lǐng)域卻還存在許多問題洁闰。主要原因在于生成的視頻很難保證前后幀的一致性,容易出現(xiàn)抖動诈闺。對于視頻問題渴庆,最直觀的想法便是加入前后幀的光流信息作為約束,Vid2Vid也不例外雅镊。由于Vid2Vid建立在pix2pixHD基礎(chǔ)之上襟雷,加入時序約束。因此可以實現(xiàn)高分辨率視頻生成

作者給出的方案

  • 生成器加入光流約束
  • 判別器加入光流信息
  • 對前景仁烹、背景分別建模

1.對生成器加入光流約束

符號定義:

  • 輸入圖像序列:s_1^T=\{s_1,s_2,\cdots,s_T\}
  • 目標(biāo)圖像序列:x_1^T=\{x_1,x_2,\cdots,x_T\}
  • 生成的圖像序列:\tilde{x}_1^T=\{\tilde{x}_1,\tilde{x}_2,\cdots,\tilde{x}_T\}

視頻-視頻轉(zhuǎn)換問題可以建模為如下一個條件分布:
p(\tilde{x}_1^T|s_1^T)=\prod_{t=1}^Tp(\tilde{x}_t|\tilde{x}_{t-L}^{t-1},s_{t-L}^t)
那么我們可以訓(xùn)練一個CNN耸弄,將條件分布p(\tilde{x}_1^T|s_1^T)建模為\tilde{x}_t=F(\tilde{x}_{t-L}^{t-1},s_{t-L}^t)
進(jìn)一步F(\tilde{x}_{t-L}^{t-1},s_{t-L}^t)可以表示為:
F(\tilde{x}_{t-L}^{t-1},s_{t-L}^t)=(1-\tilde{m}_t)\odot\tilde{w}_{t-1}(\tilde{x}_{t-1})+\tilde{m}_t\odot{\tilde{h}_t}
上面這個公式有三個未知量\tilde{w}_{t-1}\tilde{h}_t卓缰,\tilde{m}_t计呈。這三個未知量都是通過學(xué)習(xí)一個CNN得到的

\tilde{w}_{t-1}表示t-1幀到t幀的光流,光流的計算通過學(xué)習(xí)一個CNN來實現(xiàn)征唬。\tilde{w}_{t-1}(\tilde{x}_{t-1})表示利用t-1幀光流信息預(yù)測得到的第t幀的輸出\tilde{x}_t
\tilde{h}_t表示當(dāng)前幀的輸出結(jié)果捌显,也是利用CNN來實現(xiàn)。
\tilde{m}_t表示輸出結(jié)果的模糊程度总寒。

最終輸出的結(jié)果由\tilde{w}_{t-1}(\tilde{x}_{t-1})\tilde{h}_t加權(quán)得到扶歪。二者的權(quán)重通過學(xué)習(xí)一個CNN來實現(xiàn),權(quán)重代表\tilde{w}_{t-1}(\tilde{x}_{t-1})生成結(jié)果的模糊程度摄闸,越模糊善镰,則\tilde{w}_{t-1}(\tilde{x}_{t-1})的比重越低。

如何學(xué)習(xí)一個計算光流的CNN

這個其實很簡單年枕,用\tilde{w}_t表示生成前后兩幀圖片的光流炫欺,{w}_t表示目標(biāo)圖像(Ground truth)前后兩幀的光流。訓(xùn)練時只要最小化二者的重構(gòu)誤差就可以了熏兄。此外品洛,利用第t幀的光流信息以及第t幀的Ground truthx_t應(yīng)當(dāng)能夠完美重構(gòu)第t+1幀树姨。所以Loss如下:
L_{flow}=\frac{1}{T-1}\sum_{t=1}^{T-1}(\lVert\tilde{w}_t-w_t\rVert+\lVert\tilde{w}_t(x_t)-x_{t+1}\rVert)

第一點改進(jìn)就是這些啦。下面說一下第二點毫别。

2.對判別器器加入光流約束

這里作者使用了兩個判別器娃弓,一個是圖像粒度的判別器。這個比較簡答岛宦,使用CGAN认境。
另一個是視頻粒度的判別器眉孩。輸入為視頻序列及其光流信息苹熏,同樣輸入到CGAN翩蘸。

3. 對前景,背景分別建模

對于語義地圖轉(zhuǎn)換為街景圖這個任務(wù)变汪,作者還分別對前景侠坎,背景進(jìn)行建模,以加快收斂速度裙盾。具體來說实胸,可以把語義地圖中的“行人”,“車輛”當(dāng)做前景番官,“樹木”庐完,“道路”當(dāng)做背景。背景通常都是不動的徘熔,因此光流計算會很準(zhǔn)门躯,所以得到的圖像也會很清晰。因此酷师,我們可以設(shè)置一個mask讶凉,控制前景和背景的透明度。具體公式如下:
F(\tilde{x}_{t-L}^{t-1},s_{t-L}^t)=(1-\tilde{m}_t)\odot\tilde{w}_{t-1}(\tilde{x}_{t-1})+\tilde{m}_t\odot((1-m_{B,t})\odot\tilde{h}_{F,t}+m_{B,t}\odot\tilde h_{B,t}) \tilde{h}_{F,t}\tilde h_{B,t}分別代表前景和背景山孔。二者也是通過CNN實現(xiàn)懂讯,m_{B,t}是背景的不透明度。

整個文章的idea就是上述三點了台颠。對于前兩點域醇,在視頻生成領(lǐng)域非常有借鑒意義。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末蓉媳,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子锅铅,更是在濱河造成了極大的恐慌酪呻,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件盐须,死亡現(xiàn)場離奇詭異玩荠,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進(jìn)店門阶冈,熙熙樓的掌柜王于貴愁眉苦臉地迎上來闷尿,“玉大人,你說我怎么就攤上這事女坑√罹撸” “怎么了?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵匆骗,是天一觀的道長劳景。 經(jīng)常有香客問我,道長碉就,這世上最難降的妖魔是什么盟广? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮瓮钥,結(jié)果婚禮上筋量,老公的妹妹穿的比我還像新娘。我一直安慰自己碉熄,他們只是感情好桨武,可當(dāng)我...
    茶點故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著具被,像睡著了一般玻募。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上一姿,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天七咧,我揣著相機(jī)與錄音,去河邊找鬼叮叹。 笑死艾栋,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的蛉顽。 我是一名探鬼主播蝗砾,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼携冤!你這毒婦竟也來了悼粮?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤曾棕,失蹤者是張志新(化名)和其女友劉穎扣猫,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體翘地,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡申尤,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年癌幕,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片昧穿。...
    茶點故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡勺远,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出时鸵,到底是詐尸還是另有隱情胶逢,我是刑警寧澤,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布寥枝,位于F島的核電站宪塔,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏囊拜。R本人自食惡果不足惜某筐,卻給世界環(huán)境...
    茶點故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望冠跷。 院中可真熱鬧南誊,春花似錦、人聲如沸蜜托。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽橄务。三九已至幔托,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蜂挪,已是汗流浹背重挑。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留棠涮,地道東北人谬哀。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像严肪,于是被迫代替她去往敵國和親史煎。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,077評論 2 355

推薦閱讀更多精彩內(nèi)容