擴散模型與GLIDE

OpenAI最近發(fā)布了DALL-E 2.可看作是CLIP+GLIDE.
GLIDE是一個擴散模型捍掺,想弄清楚DALL-E 2,需要先了解擴散模型及GLIDE的原理乔宿。

1.DDPM

擴散模型(Diffusion Model)是一種圖像生成模型容燕,其余GAN,VAE等方法機制不同桥狡。
擴散模型包含兩個階段,從原圖逐步到噪聲的正向過程/擴散過程(forward/diffusion process)和從噪聲逐步到原圖的逆向過程(reverse process)颅围。


image.png

逆向過程
逆向過程從一張隨機高斯噪聲圖片xt開始伟葫,通過逐步去噪生成最終的結(jié)果x0 。這個過程是一個Markov Chain院促,

image.png

image.png

正向/擴散過程
采用的是一個固定的Markov chain形式筏养,即逐步地向圖片添加高斯噪聲:


image.png

可以直接獲得任意程度的加噪圖片,方便后續(xù)的訓練常拓。

模型訓練
原圖x0是本身有的渐溶,每一步添加的高斯噪聲也是有的。所以訓練過程是你想過程中弄抬,由xt去求得上一步xt-1,直到x0.

DDPM采用了一個U-Net 結(jié)構(gòu)的Autoencoder來對t時刻的噪聲進行預測茎辐,
image.png

高斯均值如下,方差采用的是一個常數(shù)眉睹。
image.png

2 Guided Diffusion - 基于類別引導的擴散模型

加入類別條件能夠比無類別條件生成獲得更好的效果荔茬,這是因為加入類別條件的時候,實際上是大大減小了生成時的多樣性竹海。OpenAI的Guided Diffusion [4]就提出了一種簡單有效的類別引導的擴散模型生成方式慕蔚。Guided Diffusion的核心思路是在逆向過程的每一步,用一個分類網(wǎng)絡對生成的圖片進行分類斋配,再基于分類分數(shù)和目標類別之間的交叉熵損失計算梯度孔飒,用梯度引導下一步的生成采樣。這個方法一個很大的優(yōu)點是艰争,不需要重新訓練擴散模型坏瞄,只需要在前饋時加入引導既能實現(xiàn)相應的生成效果。


image.png

即在每一步過程中甩卓,在計算高斯分布的均值時加上方差和分類梯度項的乘積鸠匀。基于這樣的改進逾柿,不需要重新訓練擴散模型缀棍,只需要額外訓練一個分類器宅此,就能夠有效地在添加類別引導。擴散模型由于每一次逆向過程都要過至少一遍網(wǎng)絡爬范,所以總體生成速度通常還是比較慢的父腕。

3.Semantic Guidence Diffusion

除了分類引導,還可以有文本青瀑,圖像等多種引導方式璧亮。


image.png

基于文本條件的圖像生成,即希望生成的圖像符合文本的描述斥难。
在逆向過程中枝嘶,每個迭代步要對有噪聲的圖像和文本計算embedding相似度,作為引導哑诊。


image.png

基于圖像條件的圖像生成躬络,希望生成的圖像與參考的圖像盡可能相似。
image.png
image.png

image.png

4搭儒。Classifier-Free Diffusion Guidence

帶分類器的引導擴散模型缺點是,引導函數(shù)和擴散模型分別進行訓練提茁,不利于進一步擴增模型規(guī)模淹禾,不能夠通過聯(lián)合訓練獲得更好的效果。
感覺4是針對2的茴扁,與3無關铃岔。
無分類器的做法是


image.png

根據(jù)有條件和無條件兩次的結(jié)果得到噪聲高斯估計。

5. GLIDE

no-classifer guidence 可以更好的將條件信息加入到擴散模型的訓練中去以得到更好的訓練效果峭火,但同時也會增加訓練成本毁习,因為要過兩次模型。
其中算法的核心即將前面的類別條件更新為了文本條件:


image.png

參考:https://zhuanlan.zhihu.com/p/449284962

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末卖丸,一起剝皮案震驚了整個濱河市纺且,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌稍浆,老刑警劉巖载碌,帶你破解...
    沈念sama閱讀 221,430評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異衅枫,居然都是意外死亡嫁艇,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,406評論 3 398
  • 文/潘曉璐 我一進店門弦撩,熙熙樓的掌柜王于貴愁眉苦臉地迎上來步咪,“玉大人,你說我怎么就攤上這事益楼』” “怎么了点晴?”我有些...
    開封第一講書人閱讀 167,834評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長静袖。 經(jīng)常有香客問我觉鼻,道長,這世上最難降的妖魔是什么队橙? 我笑而不...
    開封第一講書人閱讀 59,543評論 1 296
  • 正文 為了忘掉前任坠陈,我火速辦了婚禮,結(jié)果婚禮上捐康,老公的妹妹穿的比我還像新娘仇矾。我一直安慰自己,他們只是感情好解总,可當我...
    茶點故事閱讀 68,547評論 6 397
  • 文/花漫 我一把揭開白布贮匕。 她就那樣靜靜地躺著,像睡著了一般花枫。 火紅的嫁衣襯著肌膚如雪刻盐。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,196評論 1 308
  • 那天劳翰,我揣著相機與錄音敦锌,去河邊找鬼。 笑死佳簸,一個胖子當著我的面吹牛乙墙,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播生均,決...
    沈念sama閱讀 40,776評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼听想,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了马胧?” 一聲冷哼從身側(cè)響起汉买,我...
    開封第一講書人閱讀 39,671評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎佩脊,沒想到半個月后录别,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,221評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡邻吞,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,303評論 3 340
  • 正文 我和宋清朗相戀三年组题,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片抱冷。...
    茶點故事閱讀 40,444評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡崔列,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情赵讯,我是刑警寧澤盈咳,帶...
    沈念sama閱讀 36,134評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站边翼,受9級特大地震影響鱼响,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜组底,卻給世界環(huán)境...
    茶點故事閱讀 41,810評論 3 333
  • 文/蒙蒙 一丈积、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧债鸡,春花似錦江滨、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,285評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至棺弊,卻和暖如春晶密,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背模她。 一陣腳步聲響...
    開封第一講書人閱讀 33,399評論 1 272
  • 我被黑心中介騙來泰國打工惹挟, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人缝驳。 一個月前我還...
    沈念sama閱讀 48,837評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像归苍,于是被迫代替她去往敵國和親用狱。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,455評論 2 359

推薦閱讀更多精彩內(nèi)容