DeepMind改進超參數(shù)優(yōu)化:遺傳算法效果超越貝葉斯

學號:16069130022? ? ? ? 姓名:李鳳儀

鏈接:http://mp.weixin.qq.com/s/AVvno0FtMMK6E1cCeTjzyg

【嵌牛導讀】

經(jīng)常被人忽略的是,神經(jīng)網(wǎng)絡(luò)的成功是在特定的應(yīng)用情景下所取得

【嵌牛鼻子】

我們介紹了一種新的訓練神經(jīng)網(wǎng)絡(luò)的方法术浪,這種方法能夠幫助研究者快速地選擇最適用于此任務(wù)的超參數(shù)和模型

【嵌牛提問】

該技術(shù)是兩種最常用的超參數(shù)優(yōu)化方法的混合體:隨機搜索和手動微調(diào)法

【嵌牛正文】

從圍棋寿酌、Atari游戲到圖像識別、語言翻譯領(lǐng)域醇疼,神經(jīng)網(wǎng)絡(luò)都已經(jīng)取得了重大的突破。但是倔毙,經(jīng)常被人忽略的是乙濒,神經(jīng)網(wǎng)絡(luò)的成功是在特定的應(yīng)用情景下所取得,這些情景通常是在一系列研究的開始就確定好了的設(shè)置琉兜,包括所使用的神經(jīng)網(wǎng)絡(luò)的類型,所使用的數(shù)據(jù)以及訓練的方法等廊散。如今梧疲,這些設(shè)置允睹,也被稱為超參數(shù)运准,通崇允埽可以通過經(jīng)驗,隨機搜索或者大規(guī)模的研究過程來決定韭畸。

在最新發(fā)表的文章中蔓搞,我們介紹了一種新的訓練神經(jīng)網(wǎng)絡(luò)的方法,這種方法能夠幫助研究者快速地選擇最適用于此任務(wù)的超參數(shù)和模型喂分。

這種技術(shù),被稱為基于種群的訓練方法(PBT)甘萧,能夠同時訓練并優(yōu)化一些的神經(jīng)網(wǎng)絡(luò)梆掸,以便快速地尋找到最佳的網(wǎng)絡(luò)配置。更重要地是沥潭,這種方法不會增加計算的成本,能夠像傳統(tǒng)方法那樣快速地得到結(jié)果钝鸽,還能很容易地整合到現(xiàn)有的機器學習方法中。

該技術(shù)是兩種最常用的超參數(shù)優(yōu)化方法的混合體:隨機搜索和手動微調(diào)法因谎。

在隨機搜索法中颜懊,一群神經(jīng)網(wǎng)絡(luò)會被同時獨立地訓練,并在訓練結(jié)束后選出訓練性能最佳的那個模型河爹。通常情況下,只有很少一部分的神經(jīng)網(wǎng)絡(luò)訓練后能夠得到良好的超參數(shù)配置夷恍,而絕大部分神經(jīng)網(wǎng)絡(luò)訓練后得到的超參數(shù)都是不良的媳维,這無疑是在浪費計算力資源遏暴。

超參數(shù)的隨機搜索法指黎,就是同時獨立地訓練多種超參數(shù)。有些超參數(shù)會使得模型表現(xiàn)出好的性能醋安,而有些則不會。

使用手動微調(diào)法盖灸,研究者必須要推測到最佳的超參數(shù)設(shè)置磺芭,使用它們來訓練模型并評估模型的性能醉箕。這步驟需要反復(fù)的進行,直到得到令人滿意的網(wǎng)絡(luò)性能讥裤。盡管這樣能夠得到較好的性能,但這種方法的弊端就是需要消耗很長的時間间螟,有時候需要花費數(shù)周甚至數(shù)月的時間才能得到良好的超參數(shù)設(shè)置损肛。此外,雖然存在一些方法能夠自動進行微調(diào)步驟治拿,如貝葉斯優(yōu)化,它仍需要花費很長的時間劫谅,并要連續(xù)多次地訓練模型,才能得來得到最佳的超參數(shù)設(shè)置荞驴。

諸如手動微調(diào)和貝葉斯優(yōu)化的方法贯城,都是通過連續(xù)地多次訓練過程來對超參數(shù)做出調(diào)整,這使得這些方法變得耗時孙蒙。

基于種群的訓練方法项棠,和隨機搜索法一樣挎峦,可以用隨機超參數(shù)來同時訓練多個神經(jīng)網(wǎng)絡(luò)。但不同于網(wǎng)絡(luò)的獨立訓練透典,它使用剩余種群的信息來改善超參數(shù)顿苇,并對有前景的模型分配進行資源計算。這是從遺傳算法中得到的靈感纪岁,種群中的每個成員稱為工人,它們能夠從種群的剩余部分中挖掘出信息漩氨。例如遗增,一個工人可以復(fù)制另一個工人的模型參數(shù),也可以隨機改變參數(shù)當前值來探索新的超參數(shù)配置做修。

隨著種群神經(jīng)網(wǎng)絡(luò)的訓練進行,周期性地挖掘和探索超參數(shù)配置蔗坯,能確保種群里所有的工人能夠有一個好的基礎(chǔ)性能旋炒,并且新的超參數(shù)都能夠被探索到。這意味著基于種群的訓練方法能夠快速地挖掘到良好的超參數(shù)瘫镇,從而集中訓練更有前途的模型。更重要的是谚咬,它能夠在訓練過程適應(yīng)超參數(shù)的值尚粘,自動學習到最好的超參數(shù)配置。

基于種群的神經(jīng)網(wǎng)絡(luò)訓練方法,像隨機搜索法一樣開始訓練祈噪,還能允許一個工人挖掘其他工人的部分結(jié)果并在訓練過程探索新的超參數(shù)尚辑。

我們的實驗表明,基于種群的訓練方法在大量的任務(wù)和領(lǐng)域都表現(xiàn)出非常高效的性能杠茬。例如,我們嚴格地在一系列充滿挑戰(zhàn)性的強化學習問題上測試了我們的算法宁赤,如DeepMind實驗室最先進的方法栓票,雅達利(Atari)和星際爭霸2(StarCraft II)。所有的情況下走贪,基于種群的訓練方法都能夠穩(wěn)定地訓練,快速地發(fā)現(xiàn)良好的超參數(shù),并能得到超越當前最佳基準的結(jié)果强衡。

我們還發(fā)現(xiàn),基于種群的訓練方法能夠更有效地訓練生成對抗網(wǎng)絡(luò)感挥。這是個眾所周知很難進行微調(diào)的難題越败。具體地說,我們使用基于種群的訓練框架來最大化Inception Score值究飞,一種視覺保真度的度量。對此媒峡,結(jié)果有顯著的改善葵擎,Inception Score值從6.45增至6.9。

我們還將該算法應(yīng)用到Google的一個最先進的用于機器翻譯的神經(jīng)網(wǎng)絡(luò),這個神經(jīng)網(wǎng)絡(luò)通常需要花費數(shù)月的訓練時間寓涨,才能在訓練過程認真地手動微調(diào)超參數(shù)配置來得到最佳的模型性能氯檐。利用基于種群的訓練方法,我們能夠自動發(fā)現(xiàn)超參數(shù)配置男摧,得到能夠匹配于甚至超過當前性能的結(jié)果而不需要做任何調(diào)整,同時還只需要一個單一的訓練過程就能得到結(jié)果耗拓。

運用種群算法,我們在CIFAR-10數(shù)據(jù)庫訓練GANs和Ms Pacman數(shù)據(jù)庫訓練Feudal Networks (FuN)的變化情況樟插。粉紅色的點代表初始狀態(tài)竿刁,藍色的店則代表最終狀態(tài)。

我們相信這僅僅是該技術(shù)的一個開始食拜。在DeepMind,我們還發(fā)現(xiàn)基于種群的訓練方法在訓練新算法和新增超參數(shù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)方面特別有用流强。在進一步改善過程中呻待,基于種群的訓練方法將在發(fā)現(xiàn)和發(fā)展更復(fù)雜、更有用的神經(jīng)網(wǎng)絡(luò)模型方面蚕捉,擁有更有的可能性。

這項工作由Max Jaderberg, Valentin Dalibard, Simon Osindero, Wojciech M. Czarnecki, Jeff Donahue, Ali Razavi, Oriol Vinyals, Tim Green, Iain Dunning, Karen Simonyan, Chrisantha Fernando and? Koray Kavukcuoglu完成秘通。

原文鏈接:

https://deepmind.com/blog/population-based-training-neural-networks/

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末千绪,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子盹靴,更是在濱河造成了極大的恐慌,老刑警劉巖稿静,帶你破解...
    沈念sama閱讀 216,692評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件改备,死亡現(xiàn)場離奇詭異,居然都是意外死亡悬钳,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,482評論 3 392
  • 文/潘曉璐 我一進店門碉渡,熙熙樓的掌柜王于貴愁眉苦臉地迎上來母剥,“玉大人,你說我怎么就攤上這事习霹§帕ィ” “怎么了?”我有些...
    開封第一講書人閱讀 162,995評論 0 353
  • 文/不壞的土叔 我叫張陵爸吮,是天一觀的道長。 經(jīng)常有香客問我,道長锰霜,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,223評論 1 292
  • 正文 為了忘掉前任厨剪,我火速辦了婚禮友存,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘直晨。我一直安慰自己,他們只是感情好勇皇,可當我...
    茶點故事閱讀 67,245評論 6 388
  • 文/花漫 我一把揭開白布敛摘。 她就那樣靜靜地躺著,像睡著了一般兄淫。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上捕虽,一...
    開封第一講書人閱讀 51,208評論 1 299
  • 那天薯鳍,我揣著相機與錄音,去河邊找鬼挖滤。 笑死,一個胖子當著我的面吹牛伶唯,可吹牛的內(nèi)容都是我干的惧盹。 我是一名探鬼主播,決...
    沈念sama閱讀 40,091評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼粹断,長吁一口氣:“原來是場噩夢啊……” “哼嫡霞!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起诊沪,我...
    開封第一講書人閱讀 38,929評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎晕粪,沒想到半個月后渐裸,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體装悲,經(jīng)...
    沈念sama閱讀 45,346評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡剩膘,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,570評論 2 333
  • 正文 我和宋清朗相戀三年怠褐,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片奈懒。...
    茶點故事閱讀 39,739評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖溜畅,靈堂內(nèi)的尸體忽然破棺而出极祸,到底是詐尸還是另有隱情,我是刑警寧澤遥金,帶...
    沈念sama閱讀 35,437評論 5 344
  • 正文 年R本政府宣布稿械,位于F島的核電站,受9級特大地震影響美莫,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜窝撵,卻給世界環(huán)境...
    茶點故事閱讀 41,037評論 3 326
  • 文/蒙蒙 一襟铭、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蝌矛,春花似錦错英、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,677評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽献雅。三九已至,卻和暖如春侯谁,著一層夾襖步出監(jiān)牢的瞬間章钾,已是汗流浹背墙贱。 一陣腳步聲響...
    開封第一講書人閱讀 32,833評論 1 269
  • 我被黑心中介騙來泰國打工贱傀, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人府寒。 一個月前我還...
    沈念sama閱讀 47,760評論 2 369
  • 正文 我出身青樓,卻偏偏與公主長得像剖淀,于是被迫代替她去往敵國和親邪狞。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,647評論 2 354

推薦閱讀更多精彩內(nèi)容