李宏毅機器學習(二十一)無監(jiān)督學習Auto Encoder自動編碼器

我們先講講編碼器顽照,就比如我們拿手寫數(shù)字圖片无畔,我們輸入28*28維圖片,通過編碼器参袱,使其變成降維后的編碼(反應其某些特性)电谣,不過因為我們常常不知道這個code應該長什么樣,所以無法訓練抹蚀;我們也可以考慮輸入一個code剿牺,通過解碼器,輸出圖片环壤,但是這個單獨也無法訓練晒来,于是我們就考慮將2者結(jié)合起來一起訓練。

插圖1

我們之前介紹過PCA郑现,我們要求最小化x-\hat{x} ,我們就可以將x與權(quán)重矩陣W的乘積送到隱層湃崩,得到輸出c,再通過乘以W的轉(zhuǎn)置得到\hat{x} ,我們使其最接近接箫,這無形中就是形成了編碼和解碼的部分攒读,隱層輸出就是我們要的code,因為隱層的維度比x,\hat{x} 小辛友,也常常叫做瓶頸層

插圖2

當然薄扁,我們的auto-encoder可以是deep的,我們要求前后對稱的層神經(jīng)元數(shù)量一樣废累,我們看PCA那個也許就會想邓梅,我們的auto-encoder也是對稱的矩陣是互為轉(zhuǎn)置的,的確九默,這可以省一半?yún)?shù)震放,但實際我們往往不管這些直接train.

插圖3

以手寫數(shù)字為例宾毒,做了PCA降到30維驼修,我們的輸出圖片是比較模糊的殿遂,但是深層自動解碼就清晰多了

插圖4

我們把784維PCA做到2維再還原,其2維分布是比較混雜的乙各,而深層解碼后分布是有較明顯界限的

插圖5

我們可以看下自動解碼在文本搜索的應用墨礁,Vector Space Model,根據(jù)不同的文檔耳峦,創(chuàng)建不同的向量恩静,當我們要查詢的文檔,和目標文檔有較大相似度(算內(nèi)積)時蹲坷,輸出對應文檔

我們文檔向量采用bag-of-word即文檔有多少詞匯驶乾,這個向量就有多少維,然而這種處理并不能實現(xiàn)語義的分析循签,因為向量每個詞的維度是獨立的

插圖6

比如我們處理將2000詞的向量處理成2維级乐,效果如右上,而我們通過LSA分成2維時县匠,并沒有很好的效果

插圖7

我們自動編碼還可用于圖片相似搜索风科,但是用邁克爾杰克遜的一張圖片可能搜索到馬蹄鐵等詭異的東西

插圖8

自動相似圖片搜索,我們可以采用深度學習乞旦,網(wǎng)絡足夠深贼穆,足夠多神經(jīng)元后,編碼解碼得到的圖片如圖

插圖9

我們用多層網(wǎng)絡后兰粉,我們識別圖片就比較近似了故痊,起碼都是人= =

插圖10

我們還可以用auto-encoder來預訓練DNN得參數(shù),使得DNN起始參數(shù)比較好亲桦,比如我們要訓練圖左側(cè)的神經(jīng)網(wǎng)絡崖蜜,我們會現(xiàn)在右側(cè)訓練784-100-784的encoder,然后留住w1固定(這里要注意的是客峭,784-1000的時候因為是升維豫领,我們可能需要引入L1正則使只能某幾維有輸出,否則可能直接就把784送過去舔琅,其他都是0)

插圖11

再之后我們訓練784-1000-1000-1000的網(wǎng)絡等恐,使a^1,\hat{a^1 } 彼此接近,然后同理留出W2固定

插圖12

我們訓練好各系數(shù)后备蚓,再用反向傳播课蔬,微調(diào)下各系數(shù)(因為各系數(shù)本身已經(jīng)很好了),我們以前經(jīng)常通過auto-encoder調(diào)各層參數(shù)郊尝,但是現(xiàn)在其實不用auto-encoder也能將參數(shù)調(diào)的很好了

插圖13

我們自動解碼的衍生有De-noising auto-encoder二跋,其原理時,我們將輸入x加入噪聲變成x'流昏,然后使輸出和加噪聲前接近扎即,這樣我們訓練出的模型就具備了去噪聲的能力吞获。

還一個是Contractive auto-encoder,思維和上一個類似谚鄙,是當輸入改變時各拷,輸出變化比較小

插圖14

老師還列舉了2個不是DNN的模型,有興趣自己查= =

插圖15
插圖16

我們知道CNN有卷積池化闷营,但是用auto-encoder怎么做呢烤黍,就是使用反池化,反卷積層使輸出和輸入接近

插圖17

我們先講unpooling傻盟,我們都知道池化會將圖片縮小速蕊,比如4*4的圖片經(jīng)2*2池化后,就變成2*2娘赴,其中一種方法就是我們記住原來最大值的位置互例,反池化時將圖片擴大的同時,將對應位置設(shè)為池化值筝闹,其他置0媳叨。keras上面用的方法就是我們不記住原來的位置,直接將對應位置的池化值填4個位置

插圖18

我們反卷積的過程實際上就是在做卷積关顷,比如下圖我們經(jīng)過權(quán)重紅綠藍將5維變成3維糊秆,然后想將三維變成5維,就將每個維度乘權(quán)重议双,有疊加的位置相加痘番,其實這個結(jié)果就和右側(cè)我們做卷積一樣(補上了0位)

插圖19

我們之前說過encoder有其單獨用處,其實decoder也有單獨用處平痰,比如我們手寫數(shù)字汞舱,我們輸入不同的code就能得到不同的圖片,圖中是通過紅色方框區(qū)域等距取點得到的結(jié)果宗雇,我們?yōu)槭裁粗辉诩t色區(qū)域取呢昂芜,因為我們其他位置可能得不到圖片(如果你想得到圖片,就需要加上L2正則)

插圖20

我們正則后赔蒲,就可以選擇大區(qū)域泌神,就有了新的圖片,而且能發(fā)現(xiàn)一定規(guī)律舞虱,做導游越來越瘦欢际,上到下越來越斜等等

插圖21
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市矾兜,隨后出現(xiàn)的幾起案子损趋,更是在濱河造成了極大的恐慌,老刑警劉巖椅寺,帶你破解...
    沈念sama閱讀 211,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件浑槽,死亡現(xiàn)場離奇詭異墙杯,居然都是意外死亡,警方通過查閱死者的電腦和手機括荡,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來溉旋,“玉大人畸冲,你說我怎么就攤上這事」劾埃” “怎么了邑闲?”我有些...
    開封第一講書人閱讀 157,435評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長梧油。 經(jīng)常有香客問我苫耸,道長,這世上最難降的妖魔是什么儡陨? 我笑而不...
    開封第一講書人閱讀 56,509評論 1 284
  • 正文 為了忘掉前任褪子,我火速辦了婚禮,結(jié)果婚禮上骗村,老公的妹妹穿的比我還像新娘嫌褪。我一直安慰自己,他們只是感情好胚股,可當我...
    茶點故事閱讀 65,611評論 6 386
  • 文/花漫 我一把揭開白布笼痛。 她就那樣靜靜地躺著,像睡著了一般琅拌。 火紅的嫁衣襯著肌膚如雪缨伊。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,837評論 1 290
  • 那天进宝,我揣著相機與錄音刻坊,去河邊找鬼。 笑死党晋,一個胖子當著我的面吹牛紧唱,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播隶校,決...
    沈念sama閱讀 38,987評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼漏益,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了深胳?” 一聲冷哼從身側(cè)響起绰疤,我...
    開封第一講書人閱讀 37,730評論 0 267
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎舞终,沒想到半個月后轻庆,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體癣猾,經(jīng)...
    沈念sama閱讀 44,194評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,525評論 2 327
  • 正文 我和宋清朗相戀三年余爆,在試婚紗的時候發(fā)現(xiàn)自己被綠了纷宇。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,664評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡蛾方,死狀恐怖像捶,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情桩砰,我是刑警寧澤拓春,帶...
    沈念sama閱讀 34,334評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站亚隅,受9級特大地震影響硼莽,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜煮纵,卻給世界環(huán)境...
    茶點故事閱讀 39,944評論 3 313
  • 文/蒙蒙 一懂鸵、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧行疏,春花似錦矾瑰、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至货葬,卻和暖如春采幌,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背震桶。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評論 1 266
  • 我被黑心中介騙來泰國打工休傍, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人蹲姐。 一個月前我還...
    沈念sama閱讀 46,389評論 2 360
  • 正文 我出身青樓磨取,卻偏偏與公主長得像,于是被迫代替她去往敵國和親柴墩。 傳聞我的和親對象是個殘疾皇子忙厌,可洞房花燭夜當晚...
    茶點故事閱讀 43,554評論 2 349

推薦閱讀更多精彩內(nèi)容

  • 設(shè)身處地,有時候江咳,也可用來尋找對手的破綻 周明離開時是帶著微笑的逢净。沈墨若能成功,將會為他競選下屆局長添加一枚分量極...
    肆語聲閱讀 1,243評論 13 23
  • 看了一篇文章《沈從文與讀者高韻秀長達8年的婚外情》覺得還蠻有趣的。 只聽說沈從文追張家三小姐追得很辛苦爹土,而且門不當...
    Hello西西閱讀 582評論 0 0
  • 我很愛很愛你甥雕,所以不能容忍你分心
    會長大的幸福fang閱讀 176評論 0 0