統(tǒng)計學(xué)習(xí)基礎(chǔ)心得

參考來源:
https://zhuanlan.zhihu.com/p/428297409

一、統(tǒng)計學(xué)習(xí)方法由三要素

統(tǒng)計學(xué)習(xí)方法之間的不同,主要來自其模型言疗、策略、算法的不同。確定了模型、策略舵稠、算法,統(tǒng)計學(xué)習(xí)的方法也就確定了入宦,這也就是將其稱為統(tǒng)計學(xué)習(xí)三要素的原因哺徊。

二、實現(xiàn)統(tǒng)計學(xué)習(xí)方法的步驟

(1) 獲取數(shù)據(jù)集合:有限數(shù)據(jù)集合云石,用于訓(xùn)練
(2) 確定假設(shè)空間:包含所有可能的模型唉工,即學(xué)習(xí)模型的集合
(3) 確定學(xué)習(xí)策略:模型選擇的準(zhǔn)則
(4) 實現(xiàn)求解算法:最優(yōu)化模型的算法
(5) 尋優(yōu)求解:使用求解算法選擇最優(yōu)模型
(6) 預(yù)測或分析:利用學(xué)習(xí)的最優(yōu)模型對新數(shù)據(jù)進行預(yù)測或分析

三、 模型

假設(shè)空間用可以定義為決策函數(shù)的集合汹忠,通常是由一個參數(shù)向量決定的條件概率分布族淋硝,由決策函數(shù)表示的模型為非概率模型雹熬,由條件概率表示的模型為概率模型。

四谣膳、 策略

統(tǒng)計學(xué)習(xí)的目標(biāo)在于從假設(shè)空間中選取最優(yōu)模型竿报。

1、描述模型優(yōu)劣的評價指標(biāo):
(1) 損失函數(shù):度量模型一次預(yù)測的好壞继谚;
(2) 風(fēng)險函數(shù):度量平均意義下模型預(yù)測的好壞烈菌,即損失函數(shù)的期望;
(3) 經(jīng)驗風(fēng)險:關(guān)于訓(xùn)練數(shù)據(jù)集的平均損失估計花履,也稱為 經(jīng)驗損失芽世,可實際用于尋優(yōu)的目標(biāo)函數(shù)。

2诡壁、監(jiān)督學(xué)習(xí)的兩個基本策略:經(jīng)驗風(fēng)險最小化和結(jié)構(gòu)風(fēng)險最小化.
2.1 济瓢、經(jīng)驗風(fēng)險最小化(empirical risk minimization,ERM)策略:經(jīng)驗風(fēng)險最小的模型是最優(yōu)的模型;

當(dāng)樣本容量足夠大時妹卿,經(jīng)驗風(fēng)險最小化能保證有很好的學(xué)習(xí)效果旺矾,在現(xiàn)實中被廣泛采用,比如夺克,極大似然估計就是經(jīng)驗風(fēng)險最小化的一個例子箕宙。當(dāng)模型是條件概率分布,損失函數(shù)是對數(shù)損失函數(shù)時铺纽,經(jīng)驗風(fēng)險最小化就等價于極大似然估計柬帕。

當(dāng)樣本容量很小時,經(jīng)驗風(fēng)險最小化學(xué)習(xí)的效果就未必很好狡门,會產(chǎn)生"過擬合"現(xiàn)象雕崩。

2.2、結(jié)構(gòu)風(fēng)險最小化(structural risk minimization,SRM):在經(jīng)驗風(fēng)險上加上表示模型復(fù)雜度的正則化項或罰項融撞;

正則化項防止過擬合的原因:結(jié)構(gòu)風(fēng)險小需要經(jīng)驗風(fēng)險與模型復(fù)雜度同時小,模型復(fù)雜度較小則假設(shè)空間較小就不易過擬合粗蔚,因此結(jié)構(gòu)風(fēng)險小的模型往往對訓(xùn)練數(shù)據(jù)以及未知的測試數(shù)據(jù)都有較好的預(yù)測尝偎;

模型是條件概率分布、損失函數(shù)是對數(shù)損失函數(shù)鹏控、模型復(fù)雜度由模型的先驗概率表示時致扯,結(jié)構(gòu)風(fēng)險最小化就等價于最大后驗概率估計。這樣当辐,監(jiān)督學(xué)習(xí)問題就變成了經(jīng)驗風(fēng)險或結(jié)構(gòu)風(fēng)險函數(shù)的最優(yōu)化問題抖僵。這時經(jīng)驗或結(jié)構(gòu)風(fēng)險函數(shù)是最優(yōu)化的目標(biāo)函數(shù)

五、尋優(yōu)算法

尋優(yōu)算法就是尋找根據(jù)上述策略評價最優(yōu)模型的算法缘揪,通常該問題不存在解析解耍群,這就需要用數(shù)值計算的方法求解义桂。

設(shè)計尋優(yōu)算法的目標(biāo):保證找到全局最優(yōu)解,并使求解的過程更高效蹈垢。

接下來計劃:
常見的模型慷吊、策略、尋優(yōu)方法原理和使用方法曹抬、使用場景溉瓶。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市谤民,隨后出現(xiàn)的幾起案子堰酿,更是在濱河造成了極大的恐慌,老刑警劉巖张足,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件触创,死亡現(xiàn)場離奇詭異,居然都是意外死亡兢榨,警方通過查閱死者的電腦和手機嗅榕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來吵聪,“玉大人凌那,你說我怎么就攤上這事∫魇牛” “怎么了帽蝶?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長块攒。 經(jīng)常有香客問我励稳,道長,這世上最難降的妖魔是什么囱井? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任驹尼,我火速辦了婚禮,結(jié)果婚禮上庞呕,老公的妹妹穿的比我還像新娘新翎。我一直安慰自己,他們只是感情好住练,可當(dāng)我...
    茶點故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布地啰。 她就那樣靜靜地躺著,像睡著了一般讲逛。 火紅的嫁衣襯著肌膚如雪亏吝。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天盏混,我揣著相機與錄音蔚鸥,去河邊找鬼惜论。 笑死,一個胖子當(dāng)著我的面吹牛株茶,可吹牛的內(nèi)容都是我干的来涨。 我是一名探鬼主播,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼启盛,長吁一口氣:“原來是場噩夢啊……” “哼蹦掐!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起僵闯,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤卧抗,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后鳖粟,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體社裆,經(jīng)...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年向图,在試婚紗的時候發(fā)現(xiàn)自己被綠了泳秀。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,096評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡榄攀,死狀恐怖嗜傅,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情檩赢,我是刑警寧澤吕嘀,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站贞瞒,受9級特大地震影響偶房,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜军浆,卻給世界環(huán)境...
    茶點故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一棕洋、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧乒融,春花似錦拍冠、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽射众。三九已至碟摆,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間叨橱,已是汗流浹背典蜕。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工断盛, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人愉舔。 一個月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓钢猛,卻偏偏與公主長得像,于是被迫代替她去往敵國和親轩缤。 傳聞我的和親對象是個殘疾皇子命迈,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內(nèi)容