無【英偉達NIPS論文AI腦洞大開】用GAN讓晴天下大雨枫攀,小貓變獅子括饶,黑夜轉(zhuǎn)白天

【英偉達NIPS論文AI腦洞大開】用GAN讓晴天下大雨,小貓變獅子来涨,黑夜轉(zhuǎn)白天

來源:research.nvidia.com

作者:費欣欣 常佩琦

【新智元導(dǎo)讀】英偉達最近GAN相關(guān)研究和應(yīng)用方面進展迅猛图焰。在最新的一項工作中,英偉達研究人員利用生成對抗網(wǎng)絡(luò)(GAN)和無監(jiān)督學習蹦掐,創(chuàng)建了一個擁有“想象力”系統(tǒng)技羔,僅需一次數(shù)據(jù)輸入僵闯,即可模擬出其他情形,比如將冬日拍攝的照片想象為夏日藤滥,將貓想象為獅子鳖粟、老虎,大大減少網(wǎng)絡(luò)訓(xùn)練所需的標簽數(shù)據(jù)拙绊。對于在醫(yī)療向图、自動駕駛這樣標注數(shù)據(jù)少的領(lǐng)域,擁有極大應(yīng)用潛力标沪。

只“看”一次张漂,把貓“想象”成獅子,冬日變?yōu)橄奶?/p>

“在無監(jiān)督學習中使用GAN并不是新鮮事谨娜,但我們?nèi)〉昧饲八从械某晒皆埽庇ミ_在最新發(fā)表的一篇官博文章中表示。不僅如此趴梢,這項工作還能有效減少訓(xùn)練神經(jīng)網(wǎng)絡(luò)所需的標注數(shù)據(jù)數(shù)量漠畜。

這項成果指的是今年NIPS上英偉達的論文《無監(jiān)督圖像翻譯網(wǎng)絡(luò)》(Unsupervised Image-to-Image Translation Networks)。在這篇論文中坞靶,研究人員展示了一款具有“想象力”的機器學習系統(tǒng)憔狞,可以把圖像中的白天轉(zhuǎn)換成黑夜,貓變成獅子彰阴,等等瘾敢。

研究人員首先假設(shè),相似的圖像都享有一個共同的latent空間尿这,都可以映射為這個共享空間中的同一個latent表示簇抵。基于這個假設(shè)射众,他們提出了基于生成對抗網(wǎng)絡(luò)(GAN)和變分自編碼器(VAE)的一個框架碟摆。在圖像轉(zhuǎn)換(翻譯)的過程中,首先叨橱,使用VAE-GAN對每個圖像域進行建模典蜕。對抗訓(xùn)練目標與權(quán)重共享約束相互作用,強制共享latent空間在兩個域中生成相應(yīng)的圖像罗洗,然后VAE將翻譯后的圖像與各個域中的輸入圖像相關(guān)聯(lián)愉舔,最后就得到了“想象結(jié)果”。

論文中不同種類的狗的轉(zhuǎn)換結(jié)果伙菜,左邊一列是輸入

英偉達的研究人員表示轩缤,這個框架在多種無監(jiān)督圖像翻譯問題中,都生成了高清質(zhì)量的圖像。此外典奉,將這個框架應(yīng)用于領(lǐng)域自適應(yīng)(domain adaptation)問題躺翻,也在基準數(shù)據(jù)集上取得了state-of-the-art的結(jié)果丧叽。

最關(guān)鍵的是卫玖,在高質(zhì)量標注數(shù)據(jù)稀缺的當下,這種方法大大減少了網(wǎng)絡(luò)訓(xùn)練所需的標簽數(shù)據(jù)踊淳,進而減少AI的訓(xùn)練時間假瞬。研究人員表示,“以無人駕駛為例迂尝,只需捕獲一次訓(xùn)練數(shù)據(jù)脱茉,便可在不同的虛擬情景下使用,如晴天垄开、多云琴许、下雪天、雨天溉躲、夜晚榜田。”

無需預(yù)訓(xùn)練網(wǎng)絡(luò)锻梳,合成2048×1024圖像箭券,添一棵樹,加上胡子疑枯,任君編輯

類似的辩块,就在上周,英偉達和伯克利合作荆永,發(fā)布了一個名為pix2pixHD的項目废亭。Pix2pixHD利用條件GAN進行高清圖像合成和處理(分辨率2048x1024),輸入語義標注圖具钥,系統(tǒng)能夠生成逼真的現(xiàn)實世界圖像滔以,例如街景、人臉氓拼。

作者在論文《使用條件GAN進行高清圖像合成和語義操縱》(High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs)中介紹了他們的方法你画。他們提出了一種多尺度的生成器和判別器架構(gòu),結(jié)合新的對抗學習目標函數(shù)桃漾。實驗結(jié)果表明坏匪,條件GAN能夠合成高分辨率、照片級逼真的圖像撬统,不需要任何手工損失或預(yù)訓(xùn)練的網(wǎng)絡(luò)适滓。

不僅如此,作者還提出了一種方法恋追,讓用戶能夠交互式地編輯物體的外觀凭迹,大大豐富了生成的數(shù)據(jù)類型罚屋。例如,在下面的視頻中嗅绸,你可以發(fā)現(xiàn)用戶能夠選擇更換街景中車輛的顏色和型號脾猛,給街景圖增加一些樹木,或者改變街道類型(例如將水泥路變成十字路)鱼鸠。類似地猛拴,利用語義標注圖合成人臉時,給定語義標注的人臉圖像蚀狰,你可以選擇組合人的五官愉昆,調(diào)整大小膚色,添加胡子等麻蹋。

作者在文中指出跛溉,他們的方法可以擴展到其他領(lǐng)域,尤其是醫(yī)療圖像這樣缺乏預(yù)訓(xùn)練網(wǎng)絡(luò)的領(lǐng)域扮授。

在這里芳室,還不得不提一下英偉達此前在官網(wǎng)發(fā)表了一篇已經(jīng)提交給 ICLR 2018 的論文“Progressive Growing of GANs for Improved Quality, Stability, and Variation”,提出了一種以漸進增大的方式訓(xùn)練GAN的方法糙箍。作者表示渤愁,這不僅穩(wěn)定了訓(xùn)練,還生成了迄今質(zhì)量最高的GAN生成的圖像深夯。

例如上面的人像抖格,忽略背景,幾乎與真實照片無異咕晋。

英偉達:積極推進GAN在醫(yī)療圖像和自動駕駛落地

這些研究充分證明了生成模型的潛力雹拄,尤其是在無監(jiān)督的情況下。現(xiàn)在的英偉達掌呜,已經(jīng)遠遠不止一家專注游戲的GPU公司滓玖,一直在試圖將其硬件推向邊緣設(shè)備,并使用人工智能作為實現(xiàn)這一點的手段和工具质蕉。

上周势篡,英偉達宣布與通用電氣醫(yī)療(GE Healthcare)達成協(xié)議,通過Revolution Frontier CT模暗,更新全球部署的500,000臺醫(yī)療成像設(shè)備禁悠,以便在醫(yī)院進行更好的成像。而英偉達在自動駕駛領(lǐng)域更是布局已久兑宇,今年10月還發(fā)布了全球首款A(yù)I自動駕駛平臺碍侦,瞄準L5級自動駕駛。而上述研究無一例外,均在醫(yī)療圖像和自動駕駛領(lǐng)域有應(yīng)用潛力瓷产。

英偉達第三季度財報顯示站玄,截至10月29日的第三季度英偉達營收26.4億美元,同比增長31.5%濒旦,再次創(chuàng)新記錄株旷。其中,數(shù)據(jù)中心業(yè)務(wù)達到5.01億美元疤估,汽車業(yè)務(wù)收入1.44億美元灾常,增長至13.3%霎冯。截至目前铃拇,英偉達依靠其在人工智能和無人駕駛方面的優(yōu)勢,股價已經(jīng)上漲了約92%沈撞。

了解更多

Unsupervised Image-to-Image Translation Networks:http://papers.nips.cc/paper/6672-unsupervised-image-to-image-translation-networks.pdf

High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs:https://tcwang0509.github.io/pix2pixHD/

Progressive Growing of GANs for Improved Quality, Stability, and Variation:https://arxiv.org/abs/1710.10196

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市缠俺,隨后出現(xiàn)的幾起案子显晶,更是在濱河造成了極大的恐慌,老刑警劉巖壹士,帶你破解...
    沈念sama閱讀 216,470評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件躏救,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機坛芽,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,393評論 3 392
  • 文/潘曉璐 我一進店門吼驶,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人少办,你說我怎么就攤上這事苞慢。” “怎么了英妓?”我有些...
    開封第一講書人閱讀 162,577評論 0 353
  • 文/不壞的土叔 我叫張陵挽放,是天一觀的道長。 經(jīng)常有香客問我蔓纠,道長辑畦,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,176評論 1 292
  • 正文 為了忘掉前任贺纲,我火速辦了婚禮航闺,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己潦刃,他們只是感情好侮措,可當我...
    茶點故事閱讀 67,189評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著乖杠,像睡著了一般分扎。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上胧洒,一...
    開封第一講書人閱讀 51,155評論 1 299
  • 那天畏吓,我揣著相機與錄音,去河邊找鬼卫漫。 笑死菲饼,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的列赎。 我是一名探鬼主播宏悦,決...
    沈念sama閱讀 40,041評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼包吝!你這毒婦竟也來了饼煞?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,903評論 0 274
  • 序言:老撾萬榮一對情侶失蹤诗越,失蹤者是張志新(化名)和其女友劉穎砖瞧,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體嚷狞,經(jīng)...
    沈念sama閱讀 45,319評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡块促,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,539評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了感耙。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片褂乍。...
    茶點故事閱讀 39,703評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖即硼,靈堂內(nèi)的尸體忽然破棺而出逃片,到底是詐尸還是另有隱情,我是刑警寧澤只酥,帶...
    沈念sama閱讀 35,417評論 5 343
  • 正文 年R本政府宣布褥实,位于F島的核電站,受9級特大地震影響裂允,放射性物質(zhì)發(fā)生泄漏损离。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,013評論 3 325
  • 文/蒙蒙 一绝编、第九天 我趴在偏房一處隱蔽的房頂上張望僻澎。 院中可真熱鬧貌踏,春花似錦、人聲如沸窟勃。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,664評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽秉氧。三九已至眷昆,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間汁咏,已是汗流浹背亚斋。 一陣腳步聲響...
    開封第一講書人閱讀 32,818評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留攘滩,地道東北人帅刊。 一個月前我還...
    沈念sama閱讀 47,711評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像轰驳,于是被迫代替她去往敵國和親厚掷。 傳聞我的和親對象是個殘疾皇子弟灼,可洞房花燭夜當晚...
    茶點故事閱讀 44,601評論 2 353

推薦閱讀更多精彩內(nèi)容