本文首發(fā)自 easyAI - 人工智能知識(shí)庫(kù)
原文地址:《一文看懂生成對(duì)抗網(wǎng)絡(luò) - GANs?(基本原理+10種典型算法+13種應(yīng)用)》
生成對(duì)抗網(wǎng)絡(luò) - GANs 是最近2年很熱門(mén)的一種無(wú)監(jiān)督算法,他能生成出非常逼真的照片赊琳,圖像甚至視頻。我們手機(jī)里的照片處理軟件中就會(huì)使用到它砰碴。
本文將詳細(xì)介紹生成對(duì)抗網(wǎng)絡(luò) - GANs 的設(shè)計(jì)初衷躏筏、基本原理、10種典型算法和13種實(shí)際應(yīng)用呈枉。
GANs的設(shè)計(jì)初衷
一句話來(lái)概括 GANs 的設(shè)計(jì)動(dòng)機(jī)就是——自動(dòng)化趁尼。
人工提取特征——自動(dòng)提取特征
我們?cè)凇?a target="_blank">一文看懂深度學(xué)習(xí)(概念+優(yōu)缺點(diǎn)+典型算法)》中講過(guò),深度學(xué)習(xí)最特別最厲害的地方就是能夠自己學(xué)習(xí)特征提取猖辫。
機(jī)器的超強(qiáng)算力可以解決很多人工無(wú)法解決的問(wèn)題酥泞。自動(dòng)化后,學(xué)習(xí)能力更強(qiáng)啃憎,適應(yīng)性也更強(qiáng)芝囤。
人工判斷生成結(jié)果的好壞——自動(dòng)判斷和優(yōu)化
我們?cè)凇?a target="_blank">監(jiān)督學(xué)習(xí)》中講過(guò),訓(xùn)練集需要大量的人工標(biāo)注數(shù)據(jù),這個(gè)過(guò)程是成本很高且效率很低的凡人。而人工判斷生成結(jié)果的好壞也是如此名党,有成本高和效率低的問(wèn)題。
而 GANs 能自動(dòng)完成這個(gè)過(guò)程挠轴,且不斷的優(yōu)化,這是一種效率非常高耳幢,且成本很低的方式岸晦。GANs是如何實(shí)現(xiàn)自動(dòng)化的呢?下面我們講解一下他的原理睛藻。
生成對(duì)抗網(wǎng)絡(luò) GANs 的基本原理
大白話版本
知乎上有一個(gè)很不錯(cuò)的解釋启上,大家應(yīng)該都能理解:
假設(shè)一個(gè)城市治安混亂,很快店印,這個(gè)城市里就會(huì)出現(xiàn)無(wú)數(shù)的小偷冈在。在這些小偷中,有的可能是盜竊高手按摘,有的可能毫無(wú)技術(shù)可言包券。假如這個(gè)城市開(kāi)始整飭其治安,突然開(kāi)展一場(chǎng)打擊犯罪的「運(yùn)動(dòng)」炫贤,警察們開(kāi)始恢復(fù)城市中的巡邏溅固,很快,一批「學(xué)藝不精」的小偷就被捉住了兰珍。之所以捉住的是那些沒(méi)有技術(shù)含量的小偷侍郭,是因?yàn)榫靷兊募夹g(shù)也不行了,在捉住一批低端小偷后掠河,城市的治安水平變得怎樣倒還不好說(shuō)亮元,但很明顯,城市里小偷們的平均水平已經(jīng)大大提高了唠摹。
警察們開(kāi)始繼續(xù)訓(xùn)練自己的破案技術(shù)爆捞,開(kāi)始抓住那些越來(lái)越狡猾的小偷。隨著這些職業(yè)慣犯?jìng)兊穆渚W(wǎng)跃闹,警察們也練就了特別的本事嵌削,他們能很快能從一群人中發(fā)現(xiàn)可疑人員,于是上前盤(pán)查望艺,并最終逮捕嫌犯苛秕;小偷們的日子也不好過(guò)了,因?yàn)榫靷兊乃酱蟠筇岣哒夷绻€想以前那樣表現(xiàn)得鬼鬼祟祟艇劫,那么很快就會(huì)被警察捉住。
為了避免被捕店煞,小偷們努力表現(xiàn)得不那么「可疑」蟹演,而魔高一尺、道高一丈顷蟀,警察也在不斷提高自己的水平酒请,爭(zhēng)取將小偷和無(wú)辜的普通群眾區(qū)分開(kāi)。隨著警察和小偷之間的這種「交流」與「切磋」鸣个,小偷們都變得非常謹(jǐn)慎羞反,他們有著極高的偷竊技巧,表現(xiàn)得跟普通群眾一模一樣囤萤,而警察們都練就了「火眼金睛」昼窗,一旦發(fā)現(xiàn)可疑人員,就能馬上發(fā)現(xiàn)并及時(shí)控制——最終涛舍,我們同時(shí)得到了最強(qiáng)的小偷和最強(qiáng)的警察澄惊。
非大白話版本
生成對(duì)抗網(wǎng)絡(luò)(GANs)由2個(gè)重要的部分構(gòu)成:
- 生成器(Generator):通過(guò)機(jī)器生成數(shù)據(jù)(大部分情況下是圖像),目的是“騙過(guò)”判別器
- 判別器(Discriminator):判斷這張圖像是真實(shí)的還是機(jī)器生成的富雅,目的是找出生成器做的“假數(shù)據(jù)”
下面詳細(xì)介紹一下過(guò)程:
第一階段:固定「判別器D」掸驱,訓(xùn)練「生成器G」
我們使用一個(gè)還 OK 判別器,讓一個(gè)「生成器G」不斷生成“假數(shù)據(jù)”吹榴,然后給這個(gè)「判別器D」去判斷亭敢。
一開(kāi)始,「生成器G」還很弱图筹,所以很容易被揪出來(lái)帅刀。
但是隨著不斷的訓(xùn)練,「生成器G」技能不斷提升远剩,最終騙過(guò)了「判別器D」扣溺。
到了這個(gè)時(shí)候,「判別器D」基本屬于瞎猜的狀態(tài)瓜晤,判斷是否為假數(shù)據(jù)的概率為50%锥余。
第二階段:固定「生成器G」痢掠,訓(xùn)練「判別器D」
當(dāng)通過(guò)了第一階段驱犹,繼續(xù)訓(xùn)練「生成器G」就沒(méi)有意義了。這個(gè)時(shí)候我們固定「生成器G」足画,然后開(kāi)始訓(xùn)練「判別器D」雄驹。
「判別器D」通過(guò)不斷訓(xùn)練,提高了自己的鑒別能力淹辞,最終他可以準(zhǔn)確的判斷出所有的假圖片医舆。
到了這個(gè)時(shí)候,「生成器G」已經(jīng)無(wú)法騙過(guò)「判別器D」。
循環(huán)階段一和階段二
通過(guò)不斷的循環(huán)爷速,「生成器G」和「判別器D」的能力都越來(lái)越強(qiáng)。
最終我們得到了一個(gè)效果非常好的「生成器G」霞怀,我們就可以用它來(lái)生成我們想要的圖片了惫东。
下面的實(shí)際應(yīng)用部分會(huì)展示很多“驚艷”的案例。
如果對(duì) GANs 的詳細(xì)技術(shù)原理感興趣凿蒜,可以看看下面2篇文章:
《生成性對(duì)抗網(wǎng)絡(luò)(GAN)初學(xué)者指南 – 附代碼》
《長(zhǎng)文解釋生成對(duì)抗網(wǎng)絡(luò)GAN的詳細(xì)原理(20分鐘閱讀)》
GANs的優(yōu)缺點(diǎn)
3個(gè)優(yōu)勢(shì)
- 能更好建模數(shù)據(jù)分布(圖像更銳利、清晰)
- 理論上胁黑,GANs 能訓(xùn)練任何一種生成器網(wǎng)絡(luò)。其他的框架需要生成器網(wǎng)絡(luò)有一些特定的函數(shù)形式州泊,比如輸出層是高斯的丧蘸。
- 無(wú)需利用馬爾科夫鏈反復(fù)采樣,無(wú)需在學(xué)習(xí)過(guò)程中進(jìn)行推斷遥皂,沒(méi)有復(fù)雜的變分下界力喷,避開(kāi)近似計(jì)算棘手的概率的難題。
2個(gè)缺陷
- 難訓(xùn)練演训,不穩(wěn)定弟孟。生成器和判別器之間需要很好的同步,但是在實(shí)際訓(xùn)練中很容易D收斂样悟,G發(fā)散拂募。D/G 的訓(xùn)練需要精心的設(shè)計(jì)。
- 模式缺失(Mode Collapse)問(wèn)題窟她。GANs的學(xué)習(xí)過(guò)程可能出現(xiàn)模式缺失陈症,生成器開(kāi)始退化扰付,總是生成同樣的樣本點(diǎn)潭枣,無(wú)法繼續(xù)學(xué)習(xí)桑逝。
擴(kuò)展閱讀:《為什么訓(xùn)練生成對(duì)抗網(wǎng)絡(luò)如此困難?巷屿?》閱讀這篇文章對(duì)數(shù)學(xué)要求很高
10大典型的GANs算法
GANs 算法有數(shù)百種之多志电,大家對(duì)于 GANs 的研究呈指數(shù)級(jí)的上漲卧秘,目前每個(gè)月都有數(shù)百篇論壇是關(guān)于對(duì)抗網(wǎng)絡(luò)的钓瞭。
下圖是每個(gè)月關(guān)于 GANs 的論文發(fā)表數(shù)量:
如果你對(duì) GANs 算法感興趣袍嬉,可以在 「GANs動(dòng)物園」里查看幾乎所有的算法颁井。我們?yōu)榇蠹覐谋姸嗨惴ㄖ刑暨x了10個(gè)比較有代表性的算法厅贪,技術(shù)人員可以看看他的論文和代碼。
算法 | 論文 | 代碼 |
---|---|---|
GAN | 論文地址 | 代碼地址 |
DCGAN | 論文地址 | 代碼地址 |
CGAN | 論文地址 | 代碼地址 |
CycleGAN | 論文地址 | 代碼地址 |
CoGAN | 論文地址 | 代碼地址 |
ProGAN | 論文地址 | 代碼地址 |
WGAN | 論文地址 | 代碼地址 |
SAGAN | 論文地址 | 代碼地址 |
BigGAN | 論文地址 | 代碼地址 |
上面內(nèi)容整理自《Generative Adversarial Networks - The Story So Far》原文中對(duì)算法有一些粗略的說(shuō)明蚤蔓,感興趣的可以看看卦溢。
GANs 的13種實(shí)際應(yīng)用
GANs 看上去不如「語(yǔ)音識(shí)別」「文本挖掘」那么直觀。不過(guò)他的應(yīng)用已經(jīng)進(jìn)入到我們的生活中了。下面給大家列舉一些 GANs 的實(shí)際應(yīng)用单寂。
生成圖像數(shù)據(jù)集
人工智能的訓(xùn)練是需要大量的數(shù)據(jù)集的贬芥,如果全部靠人工收集和標(biāo)注,成本是很高的宣决。GANs 可以自動(dòng)的生成一些數(shù)據(jù)集蘸劈,提供低成本的訓(xùn)練數(shù)據(jù)。
生成人臉照片
生成人臉照片是大家很熟悉的應(yīng)用尊沸,但是生成出來(lái)的照片用來(lái)做什么是需要思考的問(wèn)題威沫。因?yàn)檫@種人臉照片還處于法律的邊緣。
生成照片洼专、漫畫(huà)人物
GANs 不但能生成人臉棒掠,還能生成其他類型的照片,甚至是漫畫(huà)人物屁商。
圖像到圖像的轉(zhuǎn)換
簡(jiǎn)單說(shuō)就是把一種形式的圖像轉(zhuǎn)換成另外一種形式的圖像烟很,就好像加濾鏡一樣神奇。例如:
- 把草稿轉(zhuǎn)換成照片
- 把衛(wèi)星照片轉(zhuǎn)換為Google地圖的圖片
- 把照片轉(zhuǎn)換成油畫(huà)
- 把白天轉(zhuǎn)換成黑夜
文字到圖像的轉(zhuǎn)換
在2016年標(biāo)題為“ StackGAN:使用 StackGAN 的文本到逼真照片的圖像合成 ”的論文中官还,演示了使用 GAN芹橡,特別是他們的 StackGAN,從鳥(niǎo)類和花卉等簡(jiǎn)單對(duì)象的文本描述中生成逼真的照片望伦。
語(yǔ)意 - 圖像 - 照片 的轉(zhuǎn)換
在2017年標(biāo)題為“ 高分辨率圖像合成和帶條件GAN的語(yǔ)義操縱 ”的論文中林说,演示了在語(yǔ)義圖像或草圖作為輸入的情況下使用條件GAN生成逼真圖像。
自動(dòng)生成模特
在2017年標(biāo)題為“ 姿勢(shì)引導(dǎo)人形象生成 ”的論文中屡谐,可以自動(dòng)生成人體模特述么,并且使用新的姿勢(shì)。
照片到Emojis
GANs 可以通過(guò)人臉照片自動(dòng)生成對(duì)應(yīng)的表情(Emojis)愕掏。
照片編輯
使用GANs可以生成特定的照片度秘,例如更換頭發(fā)顏色、更改面部表情饵撑、甚至是改變性別剑梳。
預(yù)測(cè)不同年齡的長(zhǎng)相
給一張人臉照片, GANs 就可以幫你預(yù)測(cè)不同年齡階段你會(huì)長(zhǎng)成什么樣滑潘。
提高照片分辨率垢乙,讓照片更清晰
給GANs 一張照片,他就能生成一張分辨率更高的照片语卤,使得這個(gè)照片更加清晰追逮。
照片修復(fù)
假如照片中有一個(gè)區(qū)域出現(xiàn)了問(wèn)題(例如被涂上顏色或者被抹去),GANs可以修復(fù)這個(gè)區(qū)域钮孵,還原成原始的狀態(tài)骂倘。
自動(dòng)生成3D模型
給出多個(gè)不同角度的2D圖像巴席,就可以生成一個(gè)3D模型历涝。
- 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)恤煞,“玉大人,你說(shuō)我怎么就攤上這事施籍【影牵” “怎么了?”我有些...
- 文/不壞的土叔 我叫張陵丑慎,是天一觀的道長(zhǎng)喜喂。 經(jīng)常有香客問(wèn)我,道長(zhǎng)竿裂,這世上最難降的妖魔是什么玉吁? 我笑而不...
- 正文 為了忘掉前任,我火速辦了婚禮腻异,結(jié)果婚禮上进副,老公的妹妹穿的比我還像新娘。我一直安慰自己悔常,他們只是感情好影斑,可當(dāng)我...
- 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著机打,像睡著了一般矫户。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上残邀,一...
- 那天皆辽,我揣著相機(jī)與錄音柑蛇,去河邊找鬼。 笑死驱闷,一個(gè)胖子當(dāng)著我的面吹牛耻台,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播遗嗽,決...
- 文/蒼蘭香墨 我猛地睜開(kāi)眼粘我,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了痹换?” 一聲冷哼從身側(cè)響起征字,我...
- 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎娇豫,沒(méi)想到半個(gè)月后匙姜,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
- 正文 獨(dú)居荒郊野嶺守林人離奇死亡冯痢,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
- 正文 我和宋清朗相戀三年氮昧,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片浦楣。...
- 正文 年R本政府宣布历恐,位于F島的核電站寸癌,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏弱贼。R本人自食惡果不足惜蒸苇,卻給世界環(huán)境...
- 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望吮旅。 院中可真熱鬧溪烤,春花似錦、人聲如沸鸟辅。這莊子的主人今日做“春日...
- 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)匪凉。三九已至枪眉,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間再层,已是汗流浹背贸铜。 一陣腳步聲響...
- 正文 我出身青樓烤镐,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親棍鳖。 傳聞我的和親對(duì)象是個(gè)殘疾皇子炮叶,可洞房花燭夜當(dāng)晚...
推薦閱讀更多精彩內(nèi)容
- 本文轉(zhuǎn)自「中國(guó)計(jì)算機(jī)學(xué)會(huì)」(訂閱號(hào):ccfvoice),經(jīng)平臺(tái)同意授權(quán)轉(zhuǎn)載渡处。 恭喜今日頭條AI Lab論文《從生成...
- 本文將使用 TensorFlow 實(shí)現(xiàn)深度卷積生成對(duì)抗網(wǎng)絡(luò)(DCGAN)镜悉,并用其訓(xùn)練生成一些小姐姐的圖像。其中医瘫,訓(xùn)...
- 沒(méi)點(diǎn)進(jìn)來(lái)的兄弟可能已經(jīng)在評(píng)論區(qū)吐槽了 啊醇份,人家是supreme(蘇普瑞木)稼锅,好伐~ 恩,老咪一直都是很皮的 我可不...
- 跑出你我,賽出青春怖竭∈G纾——導(dǎo)語(yǔ) 2017年11月10日中午十二點(diǎn)三十分,由江西師范大...