統(tǒng)計(jì)學(xué)習(xí)方法-第1章統(tǒng)計(jì)學(xué)習(xí)方概論

這本書主講的內(nèi)容包括:

1.統(tǒng)計(jì)學(xué)習(xí)的定義众旗、研究對(duì)象與方法夕土;

2.監(jiān)督學(xué)習(xí)

3.統(tǒng)計(jì)學(xué)習(xí)方法的三要素:方法=模型+策略+算法

4.介紹模型選擇,包括正則化井誉、交叉驗(yàn)證與學(xué)習(xí)的泛化能力

5.介紹生成模型與判別模型

6.監(jiān)督學(xué)習(xí)方法的應(yīng)用:分類問題蕉扮、標(biāo)注問題、回歸問題

1.1 統(tǒng)計(jì)學(xué)習(xí)

1.統(tǒng)計(jì)學(xué)習(xí)的目的:考慮什么樣的模型送悔、如何學(xué)習(xí)該模型慢显、盡可能優(yōu)化模型提高效率

2.假設(shè)空間:假設(shè)要學(xué)習(xí)的模型的屬于某個(gè)函數(shù)集合,學(xué)習(xí)模型是H(x)

3.統(tǒng)計(jì)學(xué)習(xí)方法的步驟:得到有限的訓(xùn)練數(shù)據(jù)集合欠啤、確定包含所有模型的假設(shè)空間、確定模型的選擇準(zhǔn)則屋灌,即學(xué)習(xí)方法洁段、實(shí)現(xiàn)求解最優(yōu)模型的算法,即學(xué)習(xí)的算法共郭、通過學(xué)習(xí)算法選擇最優(yōu)模型祠丝、利用最優(yōu)模型最數(shù)據(jù)進(jìn)行預(yù)測(cè)和分析。

1.2監(jiān)督學(xué)習(xí)

4.特征空間:輸出的實(shí)例由特征向量表示X=(x1,x2,...,xn)除嘹,特征向量存在的空間是特征空間

5.回歸問題:輸入變量和輸出變量均為連續(xù)變量的預(yù)測(cè)問題

6.分類問題:輸出變量為有限個(gè)離散變量的預(yù)測(cè)問題

1.3統(tǒng)計(jì)學(xué)習(xí)的三要素

7.模型:假設(shè)空間

8.策略:引入損失函數(shù)或代價(jià)函數(shù)的概念

? ? ? ? ? ? ?(1)損失或者代價(jià)函數(shù):度量模型的一次預(yù)測(cè)的好壞

? ? ? ? ? ? ?(2)風(fēng)險(xiǎn)函數(shù):度量平均意義下模型的好壞??

? ? ? ? ? ? ?(3)經(jīng)驗(yàn)風(fēng)險(xiǎn):模型f(x)關(guān)于訓(xùn)練數(shù)據(jù)集的平均損失

9.經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化與結(jié)構(gòu)風(fēng)險(xiǎn)最小化

? ? ? ? ? ? ?(1)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化:平均損失最小写半,模型達(dá)到最優(yōu)化

? ? ? ? ? ? ?(2)結(jié)構(gòu)風(fēng)險(xiǎn)最小化:經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化+懲罰項(xiàng)(防止過擬合)

1.4模型評(píng)估與模型選擇

10.測(cè)試誤差:當(dāng)損失函數(shù)給定時(shí),基于損失函數(shù)的模型的測(cè)試誤差(測(cè)試樣本)

11.訓(xùn)練誤差:當(dāng)損失函數(shù)給定時(shí)尉咕,基于損失函數(shù)的模型的訓(xùn)練誤差(訓(xùn)練樣本)

(兩者都需要確定下來損失函數(shù))

12.過擬合:意為追求提高訓(xùn)練數(shù)據(jù)的預(yù)測(cè)能力叠蝇,所選模型的復(fù)雜度則往往比真模型高。為了防止過擬合我們引入懲罰項(xiàng)年缎,使高次項(xiàng)減少來降低模型的復(fù)雜度悔捶。

1.5正則化與交叉驗(yàn)證

13.正則化:正則化是結(jié)構(gòu)風(fēng)險(xiǎn)的最小化策略的實(shí)現(xiàn),即結(jié)構(gòu)風(fēng)險(xiǎn)=經(jīng)驗(yàn)風(fēng)險(xiǎn)+正則化

正則化項(xiàng)可以是參數(shù)向量化的L2范數(shù)或者L1范數(shù):

14.交叉驗(yàn)證:訓(xùn)練集单芜、驗(yàn)證集蜕该、測(cè)試集

? ? ? ? ? ? ? ? ? ? ? ?(1).訓(xùn)練集:訓(xùn)練模型

? ? ? ? ? ? ? ? ? ? ? ?(2).驗(yàn)證集:用于模型的選擇

? ? ? ? ? ? ? ? ? ? ? ?(3).測(cè)試集:用于對(duì)最終方法的評(píng)估

1.6泛化能力

15.學(xué)習(xí)方法的泛化能力:是指由該方法學(xué)習(xí)到的模型對(duì)未知數(shù)據(jù)的預(yù)測(cè)能力。

16.泛化誤差:所學(xué)習(xí)到的模型的期望風(fēng)險(xiǎn)

17.泛化誤差上界的性質(zhì):

? ? ? ? ? ? ? ? ? ? ? (1)樣本容量增加洲鸠,泛化誤差上界趨于0(這樣泛化能力越強(qiáng))堂淡;

? ? ? ? ? ? ? ? ? ? ? (2)假設(shè)空間容量越大,模型越難學(xué)扒腕,泛化誤差上界也越大;

1.7生成模型和判別模型

18.監(jiān)督學(xué)習(xí)方法:生成方法和判別方法

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?生成方法->生成模型

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 判別方法->判別模型

生成模型:數(shù)據(jù)學(xué)習(xí)聯(lián)合概率P(X,Y)然后求出條件概率作為預(yù)測(cè)的模型(NB绢淀、HMM)

判別模型:直接學(xué)習(xí)決策函數(shù)f(x)或者條件概率p(y|x),關(guān)心的是給定的x預(yù)測(cè)輸出什么樣的y(KNN SVM袜匿、logist更啄、感知機(jī)、DT)

1.8分類問題? ??

? ? ? ? 重點(diǎn)關(guān)注2分類問題

1.9標(biāo)注問題

? ? ? ? 標(biāo)注問題也是監(jiān)督學(xué)習(xí)問題祭务。標(biāo)注問題的輸入是觀測(cè)序列内狗,輸出是標(biāo)記序列或者狀態(tài)序列。

????????詳述見書20頁

2.0回歸問題

? ? ? ? 學(xué)習(xí)系統(tǒng)和預(yù)測(cè)系統(tǒng)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末义锥,一起剝皮案震驚了整個(gè)濱河市柳沙,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌拌倍,老刑警劉巖赂鲤,帶你破解...
    沈念sama閱讀 211,194評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異柱恤,居然都是意外死亡数初,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門梗顺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來泡孩,“玉大人,你說我怎么就攤上這事寺谤÷嘏福” “怎么了?”我有些...
    開封第一講書人閱讀 156,780評(píng)論 0 346
  • 文/不壞的土叔 我叫張陵变屁,是天一觀的道長(zhǎng)眼俊。 經(jīng)常有香客問我,道長(zhǎng)粟关,這世上最難降的妖魔是什么疮胖? 我笑而不...
    開封第一講書人閱讀 56,388評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮誊役,結(jié)果婚禮上获列,老公的妹妹穿的比我還像新娘。我一直安慰自己蛔垢,他們只是感情好击孩,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,430評(píng)論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著鹏漆,像睡著了一般巩梢。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上艺玲,一...
    開封第一講書人閱讀 49,764評(píng)論 1 290
  • 那天括蝠,我揣著相機(jī)與錄音,去河邊找鬼饭聚。 笑死忌警,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的秒梳。 我是一名探鬼主播法绵,決...
    沈念sama閱讀 38,907評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼箕速,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了朋譬?” 一聲冷哼從身側(cè)響起盐茎,我...
    開封第一講書人閱讀 37,679評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎徙赢,沒想到半個(gè)月后字柠,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,122評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡狡赐,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,459評(píng)論 2 325
  • 正文 我和宋清朗相戀三年窑业,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片枕屉。...
    茶點(diǎn)故事閱讀 38,605評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡数冬,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出搀庶,到底是詐尸還是另有隱情,我是刑警寧澤铜异,帶...
    沈念sama閱讀 34,270評(píng)論 4 329
  • 正文 年R本政府宣布哥倔,位于F島的核電站,受9級(jí)特大地震影響揍庄,放射性物質(zhì)發(fā)生泄漏咆蒿。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,867評(píng)論 3 312
  • 文/蒙蒙 一蚂子、第九天 我趴在偏房一處隱蔽的房頂上張望沃测。 院中可真熱鬧,春花似錦食茎、人聲如沸蒂破。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,734評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽附迷。三九已至,卻和暖如春哎媚,著一層夾襖步出監(jiān)牢的瞬間喇伯,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,961評(píng)論 1 265
  • 我被黑心中介騙來泰國打工拨与, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留稻据,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,297評(píng)論 2 360
  • 正文 我出身青樓买喧,卻偏偏與公主長(zhǎng)得像捻悯,于是被迫代替她去往敵國和親匆赃。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,472評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容