BicycleGAN(不是CycleGAN的升級(jí)版)
BycycleGAN
主要融合了cVAE-GAN
和cLR-GAN
严卖,形成了以及這雙重循環(huán)烟具。Loss主要是GAN_loss+L1 Loss+ KL_loss
三種類別梢什,生成器使用類似于U-net
的結(jié)構(gòu),編碼器E
使用res_block
的CNN朝聋。論文結(jié)果如下:AMT:
Amazon Mechanical Turk test
LPIPS distance:
Learned Perceptual Image Patch Similarity (LPIPS) metric computes distance in AlexNet feature space (conv1-5, pretrained on Imagenet, with linear weights to better match human perceptual judgments.
噪聲輸入方式: spatially replicate a Z-dimensional latent code z to an H? W ? Z tensor and concatenate it with the H? W ? 3 input imag
CyCADA(CycleGAN升級(jí)版)
VQ-VAE & VQ-VAE-2
一般取即可
VQ-VAE-2
相比于VQ-VAE-1
類似于金字塔形式的訓(xùn)練方式有利于生成高分辨率圖片嗡午。另外,至于基于pixelCNN
變體的采樣方式還沒有完全看明白冀痕,需要再具體了解荔睹。另外,整個(gè)形式的數(shù)學(xué)推導(dǎo)言蛇,還有待明細(xì)僻他,比如各種概率具體到圖像上的對(duì)應(yīng)關(guān)系。