有用的英文表達(dá)
since sliced bread 有史以來(形容一項(xiàng)技術(shù)非常好)
1.Basic idea of GAN
Generation
圖像生成:輸入一個向量遥赚,輸出一張圖片供炼。
Discriminator
輸入一張圖片,給出一個scalar(分?jǐn)?shù))我纪。
scalar越大悬赏,代表圖像越真實(shí);越小蒸矛,代表越假瀑罗。
Generator VS Discriminator
寫作敵人胸嘴,念做朋友
算法
- 初始化generator(G)和discriminator(D)
- 在每個訓(xùn)練周期中:
- 固定G,更新D(D學(xué)習(xí)給真實(shí)的對象高的分?jǐn)?shù),給生成的對象低的分?jǐn)?shù))
- 固定D斩祭,更新G(G學(xué)習(xí)去騙過D)
詳細(xì)的算法
IMG_0013.PNG
2.GAN as structured learning
structured learning
IMG_0014.PNG
為什么結(jié)構(gòu)化學(xué)習(xí)這么具有挑戰(zhàn)性劣像?
-
One-shot/Zero-shot Learning:
- 在分類中,每種類別都有很多樣本實(shí)例
- 在結(jié)構(gòu)化學(xué)習(xí)中
- 如果你把每個可能的輸出都看作一個“類別”摧玫。耳奕。。
- 由于輸出的空間是很大的诬像,很多“類別”是沒有訓(xùn)練數(shù)據(jù)的
- 機(jī)器學(xué)習(xí)需要在測試時產(chǎn)生新東西
- 需要更多的智能
Machine has to learn to do planning(全局觀)
結(jié)構(gòu)化學(xué)習(xí)的方法——局部+全局
IMG_0015.PNG
3.Can Generator learn by itself?
G是輸入一個向量屋群,輸出一張圖片,那輸入的向量(code)哪里來坏挠?
Encoder in auto-encoder provides the code
-
Auto-encoder的后半部分——Decoder就是一個G(Generator)
IMG_0016.PNG Auto-encoder的改進(jìn)版本:Variational Auto-encoder(VAE)
-
what do we miss?
- Each neural in output layer corresponds to a pixel.
- The relation between the components are critical.
- Although highly correlated, they cannot influence each other.
- Need deep structure to catch the relation between components.
4.Can Discriminator generate?
Discriminator的輸入是一個對象芍躏,比如一張圖象,輸出是一個scalar降狠,代表對象的好壞
-
自上而下地評價(jià)組分之間的關(guān)系是很容易的.
IMG_0017.PNG 假設(shè)我們已經(jīng)有D对竣,可以生成所有可能的對象,然后選擇中間得分最高的作為最終結(jié)果
怎么訓(xùn)練D榜配?我們只有真實(shí)圖像否纬,如何產(chǎn)生假圖?
通常的算法:給一系列真實(shí)樣本芥牌,隨機(jī)生成假的樣本
5.G和D的比較
G是從局部考慮烦味,D是全局考慮。
IMG_0019.PNG
6.Benefit of GAN
IMG_0020.PNG