【機(jī)器學(xué)習(xí)】回歸和超參數(shù)調(diào)優(yōu)Regression and Hyper-parameter Optimisation

什么是超參數(shù)

所謂超參數(shù)折砸,就是機(jī)器學(xué)習(xí)模型里面的框架參數(shù)妹孙,比如聚類方法里面類的個(gè)數(shù)倦炒,或者話題模型里面話題的個(gè)數(shù)等等,都稱為超參數(shù)刁卜。它們跟訓(xùn)練過程中學(xué)習(xí)的參數(shù)(權(quán)重)是不一樣的志电,通常是手工設(shè)定,不斷試錯(cuò)調(diào)整蛔趴,或者對一系列窮舉出來的參數(shù)組合一通枚舉(叫做網(wǎng)格搜索)挑辆。




什么是Grid Search 網(wǎng)格搜索?

Grid Search:一種調(diào)參手段孝情;窮舉搜索:在所有候選的參數(shù)選擇中鱼蝉,通過循環(huán)遍歷,嘗試每一種可能性箫荡,表現(xiàn)最好的參數(shù)就是最終的結(jié)果魁亦。其原理就像是在數(shù)組里找最大值。(為什么叫網(wǎng)格搜索羔挡?以有兩個(gè)參數(shù)的模型為例洁奈,參數(shù)a有3種可能,參數(shù)b有4種可能绞灼,把所有可能性列出來利术,可以表示成一個(gè)3*4的表格,其中每個(gè)cell就是一個(gè)網(wǎng)格镀赌,循環(huán)過程就像是在每個(gè)網(wǎng)格里遍歷氯哮、搜索际跪,所以叫g(shù)rid search)



Hyper-parameter Tuning超參數(shù)調(diào)試處理

在機(jī)器學(xué)習(xí)領(lǐng)域商佛,超參數(shù)比較少的情況下,我們之前利用設(shè)置網(wǎng)格點(diǎn)的方式來調(diào)試超參數(shù)姆打;

但在深度學(xué)習(xí)領(lǐng)域良姆,超參數(shù)較多的情況下,不是設(shè)置規(guī)則的網(wǎng)格點(diǎn)幔戏,而是隨機(jī)選擇點(diǎn)進(jìn)行調(diào)試玛追。這樣做是因?yàn)樵谖覀兲幚韱栴}的時(shí)候,是無法知道哪個(gè)超參數(shù)是更重要的闲延,所以隨機(jī)的方式去測試超參數(shù)點(diǎn)的性能痊剖,更為合理,這樣可以探究更超參數(shù)的潛在價(jià)值垒玲。如果在某一區(qū)域找到一個(gè)效果好的點(diǎn)陆馁,將關(guān)注點(diǎn)放到點(diǎn)附近的小區(qū)域內(nèi)繼續(xù)尋找。

不過有可能會(huì)出現(xiàn)over tuning的情況合愈,就是超參數(shù)太適合training data了不適合別的test data(類似于over fitting)



Regession回歸

監(jiān)督學(xué)習(xí)中叮贩,如果預(yù)測的變量是離散的击狮,我們稱其為分類(如決策樹,支持向量機(jī)等)益老,如果預(yù)測的變量是連續(xù)的彪蓬,我們稱其為回歸。

回歸(Regression):Y變量為連續(xù)數(shù)值型(continuous?numerical?variable)

如:房價(jià)捺萌,人數(shù)档冬,降雨量

分類(Classification): Y變量為類別型(categorical?variable)

如:顏色類別,電腦品牌互婿,有無信譽(yù)

回歸分析(regression analysis)

建立方程模擬兩個(gè)或者多個(gè)變量之間的關(guān)系的過程

被預(yù)測的變量叫做:因變量(dependent variable), y, 輸出(output)

被用來進(jìn)行預(yù)測的變量叫做: 自變量(independent variable), x, 輸入(input)

在統(tǒng)計(jì)學(xué)中捣郊,回歸分析(regression analysis)是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。運(yùn)用十分廣泛慈参,回歸分析按照涉及的變量的多少呛牲,分為一元回歸和多元回歸分析;按照自變量(百度百科 中這里寫的是因變量驮配,個(gè)人覺得應(yīng)該是自變量)的多少娘扩,可分為簡單回歸分析和多重回歸分析;按照自變量和因變量之間的關(guān)系類型壮锻,可分為線性回歸分析和非線性回歸分析琐旁。如果在回歸分析中,只包括一個(gè)自變量和一個(gè)因變量猜绣,且二者的關(guān)系可用一條直線近似表示灰殴,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個(gè)或兩個(gè)以上的自變量掰邢,且自變量之間存在線性相關(guān)牺陶,則稱為多重線性回歸分析。在大數(shù)據(jù)分析中辣之,回歸分析是一種預(yù)測性的建模技術(shù)掰伸,它研究的是因變量(目標(biāo))和自變量(預(yù)測器)之間的關(guān)系。這種技術(shù)通常用于預(yù)測分析怀估,時(shí)間序列模型以及發(fā)現(xiàn)變量之間的因果關(guān)系狮鸭。例如,司機(jī)的魯莽駕駛與道路交通事故數(shù)量之間的關(guān)系多搀,最好的研究方法就是回歸歧蕉。



線性回歸(Linear Regression)

簡單線性回歸包含一個(gè)自變量(x)和一個(gè)因變量(y),兩個(gè)變量的關(guān)系用一條直線來模擬康铭。

適用于比較直觀的關(guān)系惯退,比如銷量和收入





Gradient Descent(梯度下降)

怎么樣能夠看出線性函數(shù)擬合的好不好呢?

我們需要使用到Cost Function(代價(jià)函數(shù))麻削,代價(jià)函數(shù)越小蒸痹,說明線性回歸地越好(和訓(xùn)練集擬合地越好)春弥,當(dāng)然最小就是0,即完全擬合叠荠;

但是又一個(gè)問題引出了匿沛,雖然給定一個(gè)函數(shù),我們能夠根據(jù)cost function知道這個(gè)函數(shù)擬合的好不好榛鼎,但是畢竟函數(shù)有這么多逃呼,總不可能一個(gè)一個(gè)試吧?

因此我們引出了梯度下降:能夠找出cost function函數(shù)的最小值者娱;

梯度下降原理:將函數(shù)比作一座山抡笼,我們站在某個(gè)山坡上,往四周看黄鳍,從哪個(gè)方向向下走一小步推姻,能夠下降的最快;

當(dāng)然解決問題的方法有很多框沟,梯度下降只是其中一個(gè)藏古,還有一種方法叫Normal Equation;




下圖就詳細(xì)的說明了梯度下降的過程:


梯度下降能夠求出一個(gè)函數(shù)的最小值忍燥;

線性回歸需要求出拧晕,使得cost function的最小梅垄;

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末厂捞,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子队丝,更是在濱河造成了極大的恐慌靡馁,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件炭玫,死亡現(xiàn)場離奇詭異奈嘿,居然都是意外死亡貌虾,警方通過查閱死者的電腦和手機(jī)吞加,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來尽狠,“玉大人衔憨,你說我怎么就攤上這事“栏啵” “怎么了践图?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長沉馆。 經(jīng)常有香客問我码党,道長德崭,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任揖盘,我火速辦了婚禮眉厨,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘兽狭。我一直安慰自己憾股,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布箕慧。 她就那樣靜靜地躺著服球,像睡著了一般。 火紅的嫁衣襯著肌膚如雪颠焦。 梳的紋絲不亂的頭發(fā)上斩熊,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天,我揣著相機(jī)與錄音伐庭,去河邊找鬼座享。 笑死,一個(gè)胖子當(dāng)著我的面吹牛似忧,可吹牛的內(nèi)容都是我干的渣叛。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼盯捌,長吁一口氣:“原來是場噩夢啊……” “哼淳衙!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起饺著,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤箫攀,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后幼衰,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體靴跛,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年渡嚣,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了梢睛。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡识椰,死狀恐怖绝葡,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情腹鹉,我是刑警寧澤藏畅,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站功咒,受9級特大地震影響愉阎,放射性物質(zhì)發(fā)生泄漏绞蹦。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一榜旦、第九天 我趴在偏房一處隱蔽的房頂上張望坦辟。 院中可真熱鬧,春花似錦章办、人聲如沸锉走。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽挪蹭。三九已至,卻和暖如春休偶,著一層夾襖步出監(jiān)牢的瞬間梁厉,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工踏兜, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留词顾,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓碱妆,卻偏偏與公主長得像肉盹,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子疹尾,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345