用StyleGAN風(fēng)格遷移模型生成人臉

一種基于樣式的生成器架構(gòu)，用于生成對(duì)抗性網(wǎng)絡(luò)
Tero Karras (NVIDIA), Samuli Laine (NVIDIA), Timo Aila (NVIDIA)
http://stylegan.xyz/paper
摘要：我們借鑒風(fēng)格轉(zhuǎn)換文獻(xiàn)髓迎，提出了一種用于生成對(duì)抗網(wǎng)絡(luò)的替代生成器架構(gòu)召川。新的架構(gòu)會(huì)導(dǎo)致自動(dòng)學(xué)習(xí)，無監(jiān)督的高級(jí)屬性分離 (例如, 在人臉上訓(xùn)練時(shí)的姿勢(shì)和身份) 和生成的圖像中的隨機(jī)變化 (例如雀斑、頭發(fā))，并且使它可以直觀地、特定規(guī)模的控制合成刑枝。新生成器在傳統(tǒng)的分布質(zhì)量指標(biāo)方面改進(jìn)了最先進(jìn)的技術(shù)，從而顯著改善了插值特性, 并更好地消除了潛在的變異因素迅腔。為了量化插值質(zhì)量和分離, 我們提出了兩種新的自動(dòng)化方法, 適用于任何生成器架構(gòu)的自動(dòng)化方法装畅。最后, 我們介紹了一個(gè)新的, 高度多樣化和高質(zhì)量的人臉數(shù)據(jù)集。

系統(tǒng)要求

支持Linux和Windows沧烈，單出于性能和兼容性要求的考慮掠兄，官方建議使用Linux。
64位的Python3锌雀，建議使用Anaconda3蚂夕，且numpy版本1.14.3或更新。
支持GPU的Tensorflow版本1.10.0或更新腋逆。
一個(gè)或多個(gè)具有至少11GB DRAM的高端NVIDIA GPU婿牍。官方推薦推薦配備8個(gè)Tesla V100 GPU的NVIDIA DGX-1。
NVIDIA驅(qū)動(dòng)版本391.35或更新惩歉，CUDA工具包9.0或更新等脂，cuDNN7.3.1或更新。

這其中必須項(xiàng)有：

NVIDIA GPU的電腦（硬件條件）
NVIDIA驅(qū)動(dòng)（驅(qū)動(dòng)顯卡）
CUDA（NVIDIA并行計(jì)算框架）撑蚌，cuDNN是深度神經(jīng)網(wǎng)絡(luò)的加速庫(kù)非必須
GPU版的Tensorflow（深度學(xué)習(xí)框架）

下載運(yùn)行模型的腳本

官方提供了StyleGan的GitHub地址上遥，把代碼下載下來進(jìn)行解壓本地目錄下，同時(shí)你需要將目錄路徑添加到環(huán)境變量PYTHONPATH争涌，為的是導(dǎo)入文件夾下的模塊粉楚。
注意:變量名為PYTHONPATH，沒有就新增一個(gè)亮垫，變量值為路徑解幼。

使用預(yù)訓(xùn)練網(wǎng)絡(luò)

pretrained_example.py有給到使用預(yù)訓(xùn)練StyleGAN生成器的最小示例。執(zhí)行腳本后會(huì)從谷歌網(wǎng)盤下載預(yù)訓(xùn)練StyleGAN生成器并生成一張圖片包警，圖片會(huì)在目錄下的/results/example.png看到。因?yàn)楣雀杈W(wǎng)盤的緣故我們無法直接下載底靠，需要預(yù)訓(xùn)練模型的可以直接從這里下（提取碼: 9vx8）害晦。下載好的karras2019stylegan-ffhq-1024x1024.pkl直接放到目錄里就行。

直接在命令行下執(zhí)行 python pretrained_example.py，如果沒有網(wǎng)絡(luò)問題會(huì)見到下圖的打印信息壹瘟，這里我們直接下載好預(yù)訓(xùn)練生成器鲫剿，所以代碼需要改改，打開pretrained_example.py改成下面這樣稻轨，即把網(wǎng)絡(luò)下載變成直接讀取本地文件灵莲，并將原代碼行注釋。

# with dnnlib.util.open_url(url, cache_dir=config.cache_dir) as f:
with open('karras2019stylegan-ffhq-1024x1024.pkl', 'rb') as f:
        _G, _D, Gs = pickle.load(f)

調(diào)整完之后只要我們運(yùn)行pretrained_example.py代碼即可生成example.png圖片殴俱，如果你想生成其他隨機(jī)圖片的話只需要把5修改為其他數(shù)字即可：

rnd = np.random.RandomState(5)

example.png

generate_figures.py給出了一個(gè)更加高級(jí)的示例政冻。這個(gè)腳本復(fù)制了論文中的圖形，以說明樣式混合线欲、噪聲輸入和截?cái)?

預(yù)先訓(xùn)練好的網(wǎng)絡(luò)存儲(chǔ)為標(biāo)準(zhǔn)的pickle文件在谷歌網(wǎng)盤上明场，同樣的需要將腳本中dnnlib.util.open_url函數(shù)改成直接讀取pkl文件：

def load_Gs(file):
    if file not in _Gs_cache:
        with open(file, 'rb') as f:
            _G, _D, Gs = pickle.load(f)
        _Gs_cache[file] = Gs
    return _Gs_cache[file]

main主函數(shù)部分中的load_Gs的參數(shù)調(diào)整為文件路徑：

load_Gs('karras2019stylegan-ffhq-1024x1024.pkl')

下面的代碼將會(huì)生成dnnlib.tflib.Network的3個(gè)實(shí)例。為了生成圖像李丰，您通常需要使用Gs—另外兩個(gè)網(wǎng)絡(luò)是完整的苦锨。為了讓pickle.load()工作，你需要包含dnnlib的源目錄添加到環(huán)境變量PYTHONPATH中和tf.Session設(shè)置為默認(rèn)趴泌≈凼妫可以通過調(diào)用dnnlib.tflib.init_tf()初始化Session。

with open('karras2019stylegan-ffhq-1024x1024.pkl', 'rb') as f:
        _G, _D, Gs = pickle.load(f)
        # _G = Instantaneous snapshot of the generator. Mainly useful for resuming a previous training run.
        # _D = Instantaneous snapshot of the discriminator. Mainly useful for resuming a previous training run.
        # Gs = Long-term average of the generator. Yields higher-quality results than the instantaneous snapshot.

有三種方法使用預(yù)先訓(xùn)練的生成器：

使用Gs.run()進(jìn)行輸入和輸出為numpy數(shù)組的快速模式操作:

# 選擇特征向量
rnd = np.random.RandomState(5)
latents = rnd.randn(1, Gs.input_shape[1])

# 生成圖像
fmt = dict(func=tflib.convert_images_to_uint8, nchw_to_nhwc=True)
images = Gs.run(latents, None, truncation_psi=0.7, randomize_noise=True, output_transform=fmt)

第一個(gè)參數(shù)是一批形狀為[num, 512]的特征向量嗜憔，第二個(gè)參數(shù)預(yù)留給類別標(biāo)簽（StypeGan并沒有使用秃励，所以參數(shù)為None）。其余的關(guān)鍵字參數(shù)是可選的痹筛，可用于進(jìn)一步修改操作(參見下面)莺治。輸出是一批圖像，其格式由output_transform參數(shù)決定帚稠。

使用Gs.get_output_for()將生成器合并為一個(gè)更大的TensorFlow表達(dá)式的一部分:

latents = tf.random_normal([self.minibatch_per_gpu] + Gs_clone.input_shape[1:])
images = Gs_clone.get_output_for(latents, None, is_validation=True, randomize_noise=True)
images = tflib.convert_images_to_uint8(images)
result_expr.append(inception_clone.get_output_for(images))

前面的代碼來自metrics/frechet_inception_distance.py谣旁。它生成一批隨機(jī)圖像，并將它們直接提供給Inception-v3網(wǎng)絡(luò)滋早，而無需在中間將數(shù)據(jù)轉(zhuǎn)換為numpy數(shù)組榄审。

查找Gs.components.mapping和Gs.components.synthesis以訪問生成器的各個(gè)子網(wǎng)絡(luò)。與Gs類似杆麸，子網(wǎng)絡(luò)表示為dnnlib.tflib.Network的獨(dú)立實(shí)例:

src_latents = np.stack(np.random.RandomState(seed).randn(Gs.input_shape[1]) for seed in src_seeds)
src_dlatents = Gs.components.mapping.run(src_latents, None) # [seed, layer, component]
src_images = Gs.components.synthesis.run(src_dlatents, randomize_noise=False, **synthesis_kwargs)

上面的代碼來自generate_figures.py搁进。首先利用映射網(wǎng)絡(luò)將一批特征向量轉(zhuǎn)化為中間的W空間，然后利用合成網(wǎng)絡(luò)將這些向量轉(zhuǎn)化為一批圖像昔头。dlatents數(shù)組為合成網(wǎng)絡(luò)的每一層存儲(chǔ)同一w向量的單獨(dú)副本饼问，以方便樣式混合。

為訓(xùn)練準(zhǔn)備數(shù)據(jù)集

訓(xùn)練和評(píng)估腳本對(duì)存儲(chǔ)為多分辨率TFRecords的數(shù)據(jù)集進(jìn)行操作揭斧。每個(gè)數(shù)據(jù)集都由一個(gè)目錄表示莱革，其中包含幾個(gè)分辨率相同的圖像數(shù)據(jù)，以支持有效的流。還有一個(gè)每個(gè)分辨率單獨(dú)的*.tfrecords文件盅视，如果數(shù)據(jù)集包含標(biāo)簽捐名，它們也存儲(chǔ)在單獨(dú)的文件中。默認(rèn)情況下闹击，腳本期望在datasets/<NAME>/<NAME>-<RESOLUTION>.tfrecords中找到數(shù)據(jù)集镶蹋。可以通過編輯config.py來更改目錄:

result_dir = 'results'  # 結(jié)果目錄
data_dir = 'datasets'  # 數(shù)據(jù)目錄
cache_dir = 'cache'  # 緩存目錄

訓(xùn)練網(wǎng)絡(luò)

設(shè)置好數(shù)據(jù)集后赏半，你就可以訓(xùn)練你自己的StyleGAN網(wǎng)絡(luò)：

編輯train.py贺归，通過取消注釋或編輯特定行來指定數(shù)據(jù)集和訓(xùn)練配置。
使用python train.py來運(yùn)行訓(xùn)練腳本除破。
結(jié)果被寫入一個(gè)新創(chuàng)建的目錄results/<ID>-<DESCRIPTION>牧氮。
訓(xùn)練可能需要幾天(或幾周)才能完成，這取決于機(jī)器配置瑰枫。

使用Tesla V100 GPU的默認(rèn)配置的預(yù)計(jì)培訓(xùn)時(shí)間：

GPU	1024×1024	512×512	256×256
1	41 天 4小時(shí)	24 天 21 小時(shí)	14 天 22 小時(shí)
2	21 天 22 小時(shí)	13 天 7 小時(shí)	9 天 5 小時(shí)
4	11 天 8 小時(shí)	7 天 0 小時(shí)	4 天 21 小時(shí)
8	6 天 14 小時(shí)	4 天 10 小時(shí)	3 天 8 小時(shí)

評(píng)估質(zhì)量和分解

使用run_metrics.py可以評(píng)估本文中使用的質(zhì)量和解糾纏度量踱葛。默認(rèn)情況下，腳本將計(jì)算預(yù)訓(xùn)練的FFHQ生成器的Frechet初始距離(fid50k)光坝，并將結(jié)果寫入results下新創(chuàng)建的目錄尸诽。可以通過取消注釋或編輯run_metrics.py中的特定行來更改確切的行為盯另。使用Tesla V100 GPU預(yù)訓(xùn)練的FFHQ生成器的預(yù)期評(píng)估時(shí)間和結(jié)果:

度量	時(shí)間	結(jié)果	描述
fid50k	16 分鐘	4.4159	Fréchet Inception Distanc使用50,000張圖像瓢捉。
ppl_zfull	55 分鐘	664.8854	Z 中完整路徑的感知路徑長(zhǎng)度硼讽。
ppl_wfull	55 分鐘	233.3059	W 中完整路徑的感知路徑長(zhǎng)度奄毡。
ppl_zend	55 分鐘	666.1057	Z 中路徑端點(diǎn)的感知路徑長(zhǎng)度出革。
ppl_wend	55 分鐘	197.2266	W 中路徑端點(diǎn)的感知路徑長(zhǎng)度
ls	10 hours	z: 165.0106 w: 3.7447	Z 和 W中的線性可分性。

請(qǐng)注意芝发，由于TensorFlow的非確定性绪商，每次運(yùn)行的確切結(jié)果可能有所不同。

其他預(yù)訓(xùn)練網(wǎng)絡(luò)生成的圖片

figure11-uncurated-cars.png

figure10-uncurated-bedrooms.png

figure12-uncurated-cats.png

項(xiàng)目地址：https://github.com/NVlabs/stylegan

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末辅鲸，一起剝皮案震驚了整個(gè)濱河市格郁，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌独悴，老刑警劉巖例书，帶你破解...
沈念sama閱讀 222,807評(píng)論 6贊 518
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異刻炒，居然都是意外死亡决采，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,284評(píng)論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門坟奥，熙熙樓的掌柜王于貴愁眉苦臉地迎上來树瞭，“玉大人暂幼，你說我怎么就攤上這事∫破龋” “怎么了？”我有些...
開封第一講書人閱讀 169,589評(píng)論 0贊 363
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵管行，是天一觀的道長(zhǎng)厨埋。經(jīng)常有香客問我，道長(zhǎng)捐顷，這世上最難降的妖魔是什么荡陷？我笑而不...
開封第一講書人閱讀 60,188評(píng)論 1贊 300
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮迅涮，結(jié)果婚禮上废赞，老公的妹妹穿的比我還像新娘。我一直安慰自己叮姑，他們只是感情好唉地，可當(dāng)我...
茶點(diǎn)故事閱讀 69,185評(píng)論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著传透，像睡著了一般耘沼。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上朱盐，一...
開封第一講書人閱讀 52,785評(píng)論 1贊 314
城市分裂傳說
那天群嗤，我揣著相機(jī)與錄音，去河邊找鬼兵琳。笑死狂秘，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的躯肌。我是一名探鬼主播者春，決...
沈念sama閱讀 41,220評(píng)論 3贊 423
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼羡榴！你這毒婦竟也來了碧查？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 40,167評(píng)論 0贊 277
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤校仑，失蹤者是張志新（化名）和其女友劉穎忠售，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體迄沫，經(jīng)...
沈念sama閱讀 46,698評(píng)論 1贊 320
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡稻扬，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,767評(píng)論 3贊 343
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了羊瘩。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片泰佳。...
茶點(diǎn)故事閱讀 40,912評(píng)論 1贊 353
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡盼砍，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出逝她，到底是詐尸還是另有隱情浇坐，我是刑警寧澤，帶...
沈念sama閱讀 36,572評(píng)論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布黔宛，位于F島的核電站近刘，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏臀晃。R本人自食惡果不足惜觉渴，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 42,254評(píng)論 3贊 336
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望徽惋。院中可真熱鬧案淋，春花似錦、人聲如沸险绘。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,746評(píng)論 0贊 25
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽隆圆。三九已至漱挚，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間渺氧，已是汗流浹背旨涝。一陣腳步聲響...
開封第一講書人閱讀 33,859評(píng)論 1贊 274
情欲美人皮
我被黑心中介騙來泰國(guó)打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留侣背，地道東北人白华。一個(gè)月前我還...
沈念sama閱讀 49,359評(píng)論 3贊 379
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像贩耐，于是被迫代替她去往敵國(guó)和親弧腥。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,922評(píng)論 2贊 361