吳恩達(dá)深度學(xué)習(xí)筆記(26)-神經(jīng)網(wǎng)絡(luò)中的參數(shù)和超參數(shù)

參數(shù)VS超參數(shù)(Parameters vs Hyperparameters)

想要你的深度神經(jīng)網(wǎng)絡(luò)起很好的效果薪丁,你還需要規(guī)劃好你的參數(shù)以及超參數(shù)猎醇。

什么是超參數(shù)?

比如算法中的learning ratea(學(xué)習(xí)率)硫嘶、iterations(梯度下降法循環(huán)的數(shù)量)、L(隱藏層數(shù)目)称近、n^([l])(隱藏層單元數(shù)目)、choiceofactivationfunction(激活函數(shù)的選擇)都需要你來設(shè)置凳谦,這些數(shù)字實(shí)際上控制了最后的參數(shù)W和b的值衡未,所以它們被稱作超參數(shù)。

實(shí)際上深度學(xué)習(xí)有很多不同的超參數(shù)如失,之后我們也會(huì)介紹一些其他的超參數(shù)送粱,如momentum、mini batch size脆丁、regularization parameters等等动雹。

如何尋找超參數(shù)的最優(yōu)值洽胶?

走Idea—Code—Experiment—Idea這個(gè)循環(huán),嘗試各種不同的參數(shù)丐怯,實(shí)現(xiàn)模型并觀察是否成功翔横,然后再迭代。

今天的深度學(xué)習(xí)應(yīng)用領(lǐng)域效览,還是很經(jīng)驗(yàn)性的過程荡短,通常你有個(gè)想法掘托,比如你可能大致知道一個(gè)最好的學(xué)習(xí)率值,可能說a=0.01最好,我會(huì)想先試試看辱士,然后你可以實(shí)際試一下听绳,訓(xùn)練一下看看效果如何椅挣。然后基于嘗試的結(jié)果你會(huì)發(fā)現(xiàn),你覺得學(xué)習(xí)率設(shè)定再提高到0.05會(huì)比較好切油。如果你不確定什么值是最好的,你大可以先試試一個(gè)學(xué)習(xí)率a,再看看損失函數(shù)J的值有沒有下降娩鹉。

然后你可以試一試大一些的值稚伍,然后發(fā)現(xiàn)損失函數(shù)的值增加并發(fā)散了。然后可能試試其他數(shù)个曙,看結(jié)果是否下降的很快或者收斂到在更高的位置垦搬。你可能嘗試不同的a并觀察損失函數(shù)J這么變了,試試一組值对雪,然后可能損失函數(shù)變成這樣米绕,這個(gè)a值會(huì)加快學(xué)習(xí)過程,并且收斂在更低的損失函數(shù)值上(箭頭標(biāo)識(shí))栅干,我就用這個(gè)a值了。

在前面桑李,還有很多不同的超參數(shù)。然而星岗,當(dāng)你開始開發(fā)新應(yīng)用時(shí)戒洼,預(yù)先很難確切知道圈浇,究竟超參數(shù)的最優(yōu)值應(yīng)該是什么。所以通常磷蜀,你必須嘗試很多不同的值褐隆,并走這個(gè)循環(huán),試試各種參數(shù)衫贬。試試看5個(gè)隱藏層歇攻,這個(gè)數(shù)目的隱藏單元,實(shí)現(xiàn)模型并觀察是否成功葬毫,然后再迭代贴捡。

另一個(gè)近來深度學(xué)習(xí)的影響是它用于解決很多問題,從計(jì)算機(jī)視覺到語音識(shí)別栈暇,到自然語言處理箍镜,到很多結(jié)構(gòu)化的數(shù)據(jù)應(yīng)用,比如網(wǎng)絡(luò)廣告或是網(wǎng)頁搜索或產(chǎn)品推薦等等香缺。

我所看到過的就有很多其中一個(gè)領(lǐng)域的研究員图张,這些領(lǐng)域中的一個(gè),嘗試了不同的設(shè)置祸轮,有時(shí)候這種設(shè)置超參數(shù)的直覺可以推廣,但有時(shí)又不會(huì)柄错。所以我經(jīng)常建議人們苦酱,特別是剛開始應(yīng)用于新問題的人們疫萤,去試一定范圍的值看看結(jié)果如何。

然后在后面的筆記中扯饶,我們會(huì)用更系統(tǒng)的方法,用系統(tǒng)性的嘗試各種超參數(shù)取值尾序。

然后其次蔓同,甚至是你已經(jīng)用了很久的模型,可能你在做網(wǎng)絡(luò)廣告應(yīng)用脯爪,在你開發(fā)途中矿微,很有可能學(xué)習(xí)率的最優(yōu)數(shù)值或是其他超參數(shù)的最優(yōu)值是會(huì)變的,所以即使你每天都在用當(dāng)前最優(yōu)的參數(shù)調(diào)試你的系統(tǒng)掖举,你還是會(huì)發(fā)現(xiàn),最優(yōu)值過一年就會(huì)變化娜庇,因?yàn)殡娔X的基礎(chǔ)設(shè)施塔次,CPU或是GPU可能會(huì)變化很大。

所以有一條經(jīng)驗(yàn)規(guī)律可能每幾個(gè)月就會(huì)變名秀。如果你所解決的問題需要很多年時(shí)間励负,只要經(jīng)常試試不同的超參數(shù),勤于檢驗(yàn)結(jié)果匕得,看看有沒有更好的超參數(shù)數(shù)值继榆,相信你慢慢會(huì)得到設(shè)定超參數(shù)的直覺,知道你的問題最好用什么數(shù)值。

這可能的確是深度學(xué)習(xí)比較讓人不滿的一部分略吨,也就是你必須嘗試很多次不同可能性集币。

但參數(shù)設(shè)定這個(gè)領(lǐng)域,深度學(xué)習(xí)研究還在進(jìn)步中翠忠,所以可能過段時(shí)間就會(huì)有更好的方法決定超參數(shù)的值鞠苟,也很有可能由于CPU、GPU趾访、網(wǎng)絡(luò)和數(shù)據(jù)都在變化,這樣的指南可能只會(huì)在一段時(shí)間內(nèi)起作用云头,只要你不斷嘗試溃槐,并且嘗試保留交叉檢驗(yàn)或類似的檢驗(yàn)方法,然后挑一個(gè)對(duì)你的問題效果比較好的數(shù)值。

近來受深度學(xué)習(xí)影響牺弄,很多領(lǐng)域發(fā)生了變化蛇捌,從計(jì)算機(jī)視覺到語音識(shí)別到自然語言處理到很多結(jié)構(gòu)化的數(shù)據(jù)應(yīng)用,比如網(wǎng)絡(luò)廣告盒音、網(wǎng)頁搜索譬圣、產(chǎn)品推薦等等;

有些同一領(lǐng)域設(shè)置超參數(shù)的直覺可以推廣绳姨,但有時(shí)又不可以,特別是那些剛開始研究新問題的人們應(yīng)該去嘗試一定范圍內(nèi)的結(jié)果如何跪削,甚至那些用了很久的模型得學(xué)習(xí)率或是其他超參數(shù)的最優(yōu)值也有可能會(huì)改變揩局。

有一條經(jīng)驗(yàn)規(guī)律:經(jīng)常試試不同的超參數(shù)付枫,勤于檢查結(jié)果,看看有沒有更好的超參數(shù)取值,你將會(huì)得到設(shè)定超參數(shù)的直覺芹枷。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市绩郎,隨后出現(xiàn)的幾起案子肋杖,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,682評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異帝簇,居然都是意外死亡胧后,警方通過查閱死者的電腦和手機(jī)纸巷,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門存哲,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人修肠,你說我怎么就攤上這事嵌施。” “怎么了?”我有些...
    開封第一講書人閱讀 165,083評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長夕冲。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,763評(píng)論 1 295
  • 正文 為了忘掉前任拣帽,我火速辦了婚禮,結(jié)果婚禮上修陡,老公的妹妹穿的比我還像新娘啥纸。我一直安慰自己盾致,他們只是感情好穗酥,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評(píng)論 6 392
  • 文/花漫 我一把揭開白布判耕。 她就那樣靜靜地躺著碳竟,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上委粉,一...
    開封第一講書人閱讀 51,624評(píng)論 1 305
  • 那天祈争,我揣著相機(jī)與錄音扁藕,去河邊找鬼棍弄。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼闸度,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼哟冬!你這毒婦竟也來了错敢?” 一聲冷哼從身側(cè)響起峰锁,我...
    開封第一講書人閱讀 39,261評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤魄衅,失蹤者是張志新(化名)和其女友劉穎皆撩,沒想到半個(gè)月后滥比,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體寺滚,經(jīng)...
    沈念sama閱讀 45,722評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡讥蟆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片愕宋。...
    茶點(diǎn)故事閱讀 40,030評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡邻寿,死狀恐怖绣否,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情暮芭,我是刑警寧澤秸脱,帶...
    沈念sama閱讀 35,737評(píng)論 5 346
  • 正文 年R本政府宣布浅浮,位于F島的核電站桐腌,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏案站。R本人自食惡果不足惜躬审,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望嚼吞。 院中可真熱鬧,春花似錦蹬碧、人聲如沸舱禽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽誊稚。三九已至,卻和暖如春罗心,著一層夾襖步出監(jiān)牢的瞬間里伯,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評(píng)論 1 270
  • 我被黑心中介騙來泰國打工渤闷, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留疾瓮,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,237評(píng)論 3 371
  • 正文 我出身青樓飒箭,卻偏偏與公主長得像狼电,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子弦蹂,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容