深度學(xué)習(xí)自動調(diào)參之NNI樣例分析

作者

DeamoV
變身的大惡魔
張博涵
在之前的博文中介紹了 NNI 與其他自動機器學(xué)習(xí)工具的比較蜕乡，NNI 的安裝和使用等內(nèi)容，這篇文章你將看到：

如何修改 NNI 官方的 mnist-annotation 例子的配置文件刃唐；
官方例子支持的 Tuner 介紹；
各個 Tuner 的訓(xùn)練結(jié)果以及結(jié)果分析。

一画饥、配置文件

將 NNI 項目 clone 到本地衔瓮，進入到目錄 ~/nni/examples/trials/mnist-annotation ，NNI 有兩種配置方式抖甘，分別為 Annotation 和 Assessor报辱，nni 官方給的例子是用 Annotation 的配置方式（Assessor 可參見官方 experiment 配置參考文檔），配置文件 config.yml 默認(rèn)參數(shù)配置如下：

authorName: default
# authorName 是創(chuàng)建 Experiment 的作者单山。（你自己的名字 o(*￣▽￣*) ブ）

experimentName: example_mnist
# experimentName 是 Experiment 的名稱。
trialConcurrency: 1

#    **trialConcurrency** 定義了并行運行的 trails 的數(shù)量幅疼。
#    注意：如果 trialGpuNum 大于空閑的 GPU 數(shù)量米奸，Trial 任務(wù)會被放入隊列，等待分配 GPU 資源爽篷。

maxExecDuration: 1h
# maxExecDuration 定義 Experiment 執(zhí)行的最長時間悴晰。時間單位：{**s**, **m**, **h**, **d**}，分別代表：{*seconds*, *minutes*, *hours*, *days*}逐工。
#    注意：maxExecDuration 設(shè)置的是 Experiment 執(zhí)行的時間铡溪，不是 Trial 的。 如果 Experiment 達到了設(shè)置的最大時間泪喊，Experiment 不會停止棕硫，但不會再啟動新的 Trial 作業(yè)。

maxTrialNum: 10
# maxTrialNum 定義了你此次 Experiment 總共想要 NNI 跑多少 Trial袒啼。
trainingServicePlatform: local
#choice: local, remote, pai
# trainingServicePlatform 定義運行 Experiment 的平臺
# local：在本機的 ubuntu 上運行 Experiment哈扮。
# remote：將任務(wù)提交到遠程的 Ubuntu 上，必須用 **machineList** 來指定遠程的 SSH 連接信息蚓再。
# pai：提交任務(wù)到微軟開源的 OpenPAI 上滑肉。
# kubeflow 提交任務(wù)至 Kubeflow NNI 支持基于 Kubeflow 的 Kubenetes，以及 Azure Kubernetes

useAnnotation: true
#choice: true, false
#定義使用標(biāo)記來分析代碼并生成搜索空間摘仅。（官方例子使用的是 Annotation靶庙，所以 useAnnotation = true）

tuner:
  builtinTunerName: TPE
  #builtinTunerName 指定了系統(tǒng) Tuner 的名字，NNI SDK 提供了多種 Tuner娃属，如：{TPE, Random, Anneal, Evolution, BatchTuner, GridSearch}六荒。
  #choice: TPE, Random, Anneal, Evolution, BatchTuner
  #SMAC (SMAC should be installed through nnictl)
  classArgs:
   #classArgs** 指定了 Tuner 算法的參數(shù)。 如果 builtinTunerName 是{TPE, Random, Anneal, Evolution}矾端，用戶需要設(shè)置 optimize_mode恬吕。
    #choice: maximize, minimize
    optimize_mode: maximize

trial:
  command: python3 mnist.py
  codeDir: .
  gpuNum: 0

二、tuner 對比實驗

2.1须床、Random

建議場景

在每個 Trial 運行時間不長（例如铐料，能夠非常快的完成，或者很快的被 Assessor 終止）钠惩，并有充足計算資源的情況下柒凉。或者需要均勻的探索搜索空間。隨機搜索可作為搜索算法的基準(zhǔn)線篓跛。

參數(shù)

optimize_mode (maximize 或 minimize膝捞，可選，默認(rèn)值為 maximize) - 如果為 'maximize'愧沟，Tuner 會給出有可能產(chǎn)生較大值的參數(shù)組合蔬咬。如果為 'minimize'，Tuner 會給出有可能產(chǎn)生較小值的參數(shù)組合沐寺。

使用樣例：

# config.yml
tuner:
  builtinTunerName: Random
  classArgs:
    optimize_mode: maximize

訓(xùn)練結(jié)果：

以下為 Tuner 為 Random林艘，TrialNum 為 30 時的訓(xùn)練結(jié)果，從下圖右下角可以直觀的得出混坞，最大正確率為 98.28%狐援，展開后可看到對應(yīng)的超參值，在 Trails Detail 能夠看到所有 Trails 在不同超參選擇上的分布究孕，便于分析啥酱。

卷積核大小：7×7

隱藏層：512

學(xué)習(xí)率：0.0018762964666695628

激活函數(shù)：ReLU

池化層：最大池化

batch size：32

dropout rate：0.5

Random.png

Random2.png

結(jié)果分析：

正確率低于 30% 的 trails 隱藏層多數(shù)為 1024厨诸，學(xué)習(xí)率絕大多數(shù)低于 0.001镶殷，激活函數(shù)多數(shù)為 sigmoid。于此同時微酬，正確率高于 90% 的 trails 卷積核大小大部分為 7×7批钠，學(xué)習(xí)率主要分布在 0.001 以下。

根據(jù)以上對結(jié)果的分析得封，可以合理猜測埋心，此模型下設(shè)置卷積核大小為 7×7，學(xué)習(xí)率低于 0.001忙上，激活函數(shù)選用 relu 或 tanh拷呆，就能獲得比較理想的正確率。

2.2疫粥、TPE

建議場景

TPE 是一種黑盒優(yōu)化方法茬斧，可以使用在各種場景中，通常情況下都能得到較好的結(jié)果梗逮。特別是在計算資源有限项秉，只能運行少量 Trial 的情況。大量的實驗表明慷彤，TPE 的性能遠遠優(yōu)于隨機搜索娄蔼。

參數(shù)

optimize_mode (maximize 或 minimize怖喻，可選，默認(rèn)值為 maximize) - 如果為 'maximize'岁诉，Tuner 會給出有可能產(chǎn)生較大值的參數(shù)組合锚沸。如果為 'minimize'，Tuner 會給出有可能產(chǎn)生較小值的參數(shù)組合涕癣。

使用樣例：

# config.yml
tuner:
  builtinTunerName: TPE
  classArgs:
    optimize_mode: maximize

訓(xùn)練結(jié)果：

以下為 tuner 為 TPE哗蜈，TrialNum 為 30 時的訓(xùn)練結(jié)果，從下圖右下角可以直觀的得出坠韩，最大正確率為 98.13%距潘，展開后可看到對應(yīng)的超參值：

卷積核大小：7×7

隱藏層：1024

學(xué)習(xí)率：0.0005779853380708741

激活函數(shù)：ReLU

池化層：最大池化

batch size：16

dropout rate：0.5

TPE.png

TPE2.png

結(jié)果分析：

正確率前 50% 的 trails 隱藏層多數(shù)為 1024只搁，學(xué)習(xí)率全部低于 0.001音比，激活函數(shù)多數(shù)為 relu 和 tanh，卷積核大小大部分為 7×7 和 5×5须蜗。

根據(jù)以上對結(jié)果的分析，可以合理猜測目溉，此模型下設(shè)置卷積核大小為 7×7 或 5×5明肮，學(xué)習(xí)率低于 0.001，激活函數(shù)選用 relu 或 tanh缭付，就能獲得比較理想的正確率柿估。

2.3、Anneal

建議場景

當(dāng)每個 Trial 的時間不長陷猫，并且有足夠的計算資源時使用（與隨機搜索基本相同）秫舌。或者搜索空間的變量能從一些先驗分布中采樣。

參數(shù)

optimize_mode (maximize 或 minimize绣檬，可選足陨，默認(rèn)值為 maximize) - 如果為 'maximize'，Tuner 會給出有可能產(chǎn)生較大值的參數(shù)組合娇未。如果為 'minimize'墨缘，Tuner 會給出有可能產(chǎn)生較小值的參數(shù)組合。

使用樣例：

# config.yml
tuner:
  builtinTunerName: Anneal
  classArgs:
    optimize_mode: maximize

訓(xùn)練結(jié)果：

以下為 tuner 為 Anneal零抬，TrialNum 為 100 時的訓(xùn)練結(jié)果镊讼，從下圖右下角可以直觀的得出，最大正確率為 98.89%平夜，展開后可看到對應(yīng)的超參值：

卷積核大械濉：7×7

隱藏層：512

學(xué)習(xí)率：0.0010559236204399935

激活函數(shù)：ReLU

池化層：最大池化

batch size：32

dropout rate：0.5

Anneal.png

Anneal2.png

結(jié)果分析：

正確率前 20% 的 trails 隱藏層基本分布于 512 和 1024，學(xué)習(xí)率分布在 0.001 左右忽妒，激活函數(shù)為 relu玩裙，卷積核大小大部分為 5×5兼贸。

根據(jù)以上對結(jié)果的分析，可以合理猜測献酗，此模型下設(shè)置卷積核大小為 5×5寝受，學(xué)習(xí)率在 0.001 左右，激活函數(shù)選用 relu罕偎，隱藏層為 1024 或 512很澄，就能獲得比較理想的正確率。

2.4颜及、Evolution

建議場景

此算法對計算資源的需求相對較高甩苛。需要非常大的初始種群，以免落入局部最優(yōu)中俏站。如果 Trial 時間很短讯蒲，或者利用了 Assessor，就非常適合此算法肄扎。如果 Trial 代碼支持權(quán)重遷移墨林，即每次 Trial 會從上一輪繼承已經(jīng)收斂的權(quán)重，建議使用此算法犯祠。這會大大提高訓(xùn)練速度旭等。

參數(shù)

optimize_mode (maximize 或 minimize，可選衡载，默認(rèn)值為 maximize) - 如果為 'maximize'搔耕，Tuner 會給出有可能產(chǎn)生較大值的參數(shù)組合。如果為 'minimize'痰娱，Tuner 會給出有可能產(chǎn)生較小值的參數(shù)組合弃榨。

使用樣例：

# config.yml
tuner:
  builtinTunerName: Evolution
  classArgs:
    optimize_mode: maximize

訓(xùn)練結(jié)果：

以下為 Tuner 為 Evolution，TrialNum 為 30 時的訓(xùn)練結(jié)果梨睁，從下圖右下角可以直觀的得出鲸睛，最大正確率為 98.69%，展開后可看到對應(yīng)的超參值：卷積核大衅潞亍：5×5

隱藏層：512

學(xué)習(xí)率：0.0008152180302834592

激活函數(shù)：tanh

池化層：最大池化

batch size：32

dropout rate：0.5

Evolution.png

Evolution2.png

結(jié)果分析：

正確率前 20% 的 trails 隱藏層多數(shù)分布于 512腊凶，學(xué)習(xí)率分布在 0.001 左右較為集中，激活函數(shù)為 tanh 較為集中拴念，卷積核大小大部分為 5×5 或 3×3钧萍。

根據(jù)以上對結(jié)果的分析，可以合理猜測政鼠，此模型下設(shè)置卷積核大小為 5×5风瘦，學(xué)習(xí)率在 0.001 左右，激活函數(shù)選用 tanh公般，隱藏層為 512万搔，就能獲得比較理想的正確率胡桨。

三、總結(jié)

綜合對比不同 Tuner 的實驗結(jié)果瞬雹，發(fā)現(xiàn)不同的 Tuner 算法得出的超參分布存在一定差異性昧谊，如在使用 Anneal 時準(zhǔn)確率前 20% 的 trails 采用的激活函數(shù)都為 relu，而 Evolution 的實驗中酗捌，這部分 trails 卻是 tanh 居多呢诬。需要思考一下神經(jīng)網(wǎng)絡(luò)模型相同的情況下，是什么導(dǎo)致的這些差異性胖缤。同樣尚镰，我們在對比中也能發(fā)現(xiàn)許多一致性，通過這些一致性能夠?qū)ξ覀兊哪Ｐ驼{(diào)參工作以及對深度學(xué)習(xí)的理解給予一些啟示哪廓。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末狗唉，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子涡真，更是在濱河造成了極大的恐慌分俯，老刑警劉巖，帶你破解...
沈念sama閱讀 216,402評論 6贊 499
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件哆料，死亡現(xiàn)場離奇詭異缸剪，居然都是意外死亡，警方通過查閱死者的電腦和手機剧劝，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,377評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門橄登，熙熙樓的掌柜王于貴愁眉苦臉地迎上來抓歼，“玉大人讥此，你說我怎么就攤上這事∫テ蓿” “怎么了萄喳？”我有些...
開封第一講書人閱讀 162,483評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長蹋半。經(jīng)常有香客問我他巨，道長，這世上最難降的妖魔是什么减江？我笑而不...
開封第一講書人閱讀 58,165評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任染突，我火速辦了婚禮，結(jié)果婚禮上辈灼，老公的妹妹穿的比我還像新娘份企。我一直安慰自己，他們只是感情好巡莹，可當(dāng)我...
茶點故事閱讀 67,176評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布司志。她就那樣靜靜地躺著甜紫，像睡著了一般。火紅的嫁衣襯著肌膚如雪骂远。梳的紋絲不亂的頭發(fā)上囚霸，一...
開封第一講書人閱讀 51,146評論 1贊 297
城市分裂傳說
那天，我揣著相機與錄音激才，去河邊找鬼拓型。笑死，一個胖子當(dāng)著我的面吹牛贸营，可吹牛的內(nèi)容都是我干的吨述。我是一名探鬼主播，決...
沈念sama閱讀 40,032評論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼钞脂，長吁一口氣：“原來是場噩夢啊……” “哼揣云！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起冰啃，我...
開封第一講書人閱讀 38,896評論 0贊 274
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤邓夕，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后阎毅，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體焚刚，經(jīng)...
沈念sama閱讀 45,311評論 1贊 310
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,536評論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年扇调，在試婚紗的時候發(fā)現(xiàn)自己被綠了矿咕。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 39,696評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡狼钮，死狀恐怖碳柱，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情熬芜，我是刑警寧澤莲镣，帶...
沈念sama閱讀 35,413評論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站涎拉，受9級特大地震影響瑞侮，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜鼓拧，卻給世界環(huán)境...
茶點故事閱讀 41,008評論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一半火、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧季俩，春花似錦钮糖、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評論 0贊 22
一樁弒父案藐鹤，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽瓤檐。三九已至，卻和暖如春娱节，著一層夾襖步出監(jiān)牢的瞬間挠蛉，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,815評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工肄满，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留谴古，地道東北人。一個月前我還...
沈念sama閱讀 47,698評論 2贊 368
代替公主和親
正文我出身青樓稠歉，卻偏偏與公主長得像掰担，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子怒炸，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,592評論 2贊 353

深度學(xué)習(xí)自動調(diào)參之NNI樣例分析

作者

一画饥、配置文件

二、tuner 對比實驗

2.1须床、Random

2.2疫粥、TPE

2.3、Anneal

2.4颜及、Evolution

三、總結(jié)

推薦閱讀更多精彩內(nèi)容