李航統(tǒng)計學(xué)習(xí)--第一章統(tǒng)計方法概論

1.根據(jù)輸入輸出變量的不同類型,對預(yù)測任務(wù)進行不同的命名:

1)input怠晴,output均為連續(xù)變量--------回歸問題--函數(shù)擬合

? ? ????最常用的損失函數(shù)是:平方損失---最小二乘法求解回歸問題

? ????? 例子:為市場趨勢預(yù)測焚廊、產(chǎn)品質(zhì)量管理纵诞、客戶滿意度調(diào)查绘闷,投資風(fēng)險分析的工具

? ????????? 股票價格預(yù)測

2)output是有限個離散變量(輸入可以離散可以連續(xù))-------分類問題

? ? ? ? 分類準確率

????????對于二分類;指標:精確率precision和召回率recall

????????TP正預(yù)測為正(正確的prediction)忆肾;FN正預(yù)測為負(錯誤的N)室梅;FP負預(yù)測為正(錯誤? ? ? ?????的prediction)戏仓;TN負預(yù)測為負(正確的N)

精確率:正確的prediction/所有的被預(yù)測為正。召回率:正確的預(yù)測/所有的正預(yù)測
P R都高時候亡鼠,F(xiàn)1也高

????????分類算法:K臨近赏殃,感知機,樸素貝葉斯间涵,決策樹仁热,邏輯斯蒂回歸,支持向量機勾哩,提升方? ? ? ?????法抗蠢,貝葉斯網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)思劳,Winnow

????????例子:銀行中對客戶按照貸款風(fēng)險大小進行分類迅矛,構(gòu)建客戶分類模型;文本分類

3)input敢艰,output均為變量序列------標注問題tagging--分類問題的推廣--結(jié)構(gòu)預(yù)測問題的簡單形式

????????輸入:觀測序列诬乞;輸出:標記序列或者狀態(tài)序列

????????統(tǒng)計方法 :隱馬爾可夫模型,條件隨機場

????????在信息提取、自然語言處理等領(lǐng)域廣泛應(yīng)用

2.統(tǒng)計學(xué)習(xí)方法=模型+策略+算法

model:監(jiān)督學(xué)習(xí)中模型就是要學(xué)習(xí)的條件概率或決策函數(shù)

strategy:如何選擇最佳模型:

????????1)損失函數(shù)和風(fēng)險函數(shù)

I)0-1損失函數(shù)
II)平方損失函數(shù)
III)絕對損失函數(shù)
IV)對數(shù)損失函數(shù)

????????期望風(fēng)險Rexp(f)是模型關(guān)于聯(lián)合分布的期望損失震嫉,經(jīng)驗風(fēng)險Remp是模型關(guān)于訓(xùn)練樣本集的平均損失森瘪。

????????根據(jù)大數(shù)定理,樣本量N~無窮票堵,經(jīng)驗風(fēng)險趨近于期望風(fēng)險扼睬,但是往往訓(xùn)練樣本有限。so需要對經(jīng)驗風(fēng)險進行校正悴势。

期望風(fēng)險
經(jīng)驗風(fēng)險

????????2)對經(jīng)驗風(fēng)險進行校正-----經(jīng)驗風(fēng)險最小化和結(jié)構(gòu)風(fēng)險最小化

N足夠大時候窗宇,經(jīng)驗風(fēng)險最小化能保證有很好的學(xué)習(xí)效果,求解最優(yōu)化模型特纤,如最大似然估計军俊。當(dāng)模型是條件概率分布時,損失函數(shù)是對數(shù)損失函數(shù)捧存,經(jīng)驗風(fēng)險最小化等價于極大似然估計粪躬。N比較小時候,會產(chǎn)生過擬合
結(jié)構(gòu)風(fēng)險最小化昔穴,是為了防止過擬合镰官。等價于正則化,是在經(jīng)驗風(fēng)險加上表示模型復(fù)雜度的正則化項或罰項吗货。模型越復(fù)雜系數(shù)越大泳唠。如貝葉斯估計中的最大后驗概率估計。當(dāng)模型是條件概率分布宙搬,損失函數(shù)是對數(shù)損失函數(shù)笨腥,模型復(fù)雜度是模型的先驗概率,結(jié)構(gòu)風(fēng)險最小化等價于最大后驗概率估計害淤。

algorithm:用什么樣的計算方法求解最優(yōu)化模型

3. 訓(xùn)練誤差:判斷給定的問題是不是容易學(xué)習(xí)扇雕;測試誤差:學(xué)習(xí)方法對位置數(shù)據(jù)的預(yù)測能力(泛化能力)

過擬合:學(xué)習(xí)時選擇的模型所包含的參數(shù)過多,該模型對已知數(shù)據(jù)預(yù)測的很好窥摄,對未知數(shù)據(jù)預(yù)測很差

如何選擇模型镶奉?--正則化和交叉驗證

正則化:--結(jié)構(gòu)風(fēng)險最小化策略的實現(xiàn)

交叉驗證:若樣本數(shù)據(jù)足夠,將其分為:訓(xùn)練集崭放,驗證集和測試集

? ? 簡單交叉驗證:數(shù)據(jù)隨機分為兩部分:訓(xùn)練與測試

? ? S折交叉驗證:隨機將數(shù)據(jù)切分為S個互不相關(guān)的大小相同的子集哨苛,S-1個子集訓(xùn)練,剩余數(shù)? ?????據(jù)測試

????留一交叉驗證:S=N币砂,在數(shù)據(jù)缺乏的情況下用

生成模型與判別模型:

生成模型:數(shù)據(jù)學(xué)習(xí)聯(lián)合概率分布建峭,求出條件概率分布作為預(yù)測模型(可還原聯(lián)合概率分布,學(xué)習(xí)收斂速度更快)

????樸素貝葉斯和隱馬爾科夫模型

判別模型:直接學(xué)習(xí)決策函數(shù)f(X)或者條件概率分布P(Y/X)作為預(yù)測模型(學(xué)習(xí)的準確率更高)

????k臨近决摧,感知機亿蒸,決策樹凑兰,邏輯斯蒂回歸,最大熵模型边锁,支持向量機姑食,提升方法和條件隨機場等

4.常用的機器學(xué)習(xí)算法比較? - 知乎

機器學(xué)習(xí)包含哪些學(xué)習(xí)思想茅坛? - 知乎


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末音半,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子贡蓖,更是在濱河造成了極大的恐慌曹鸠,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,695評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件斥铺,死亡現(xiàn)場離奇詭異彻桃,居然都是意外死亡,警方通過查閱死者的電腦和手機晾蜘,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,569評論 3 399
  • 文/潘曉璐 我一進店門叛薯,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人笙纤,你說我怎么就攤上這事∽榱Γ” “怎么了省容?”我有些...
    開封第一講書人閱讀 168,130評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長燎字。 經(jīng)常有香客問我腥椒,道長,這世上最難降的妖魔是什么候衍? 我笑而不...
    開封第一講書人閱讀 59,648評論 1 297
  • 正文 為了忘掉前任笼蛛,我火速辦了婚禮,結(jié)果婚禮上蛉鹿,老公的妹妹穿的比我還像新娘滨砍。我一直安慰自己,他們只是感情好妖异,可當(dāng)我...
    茶點故事閱讀 68,655評論 6 397
  • 文/花漫 我一把揭開白布惋戏。 她就那樣靜靜地躺著,像睡著了一般他膳。 火紅的嫁衣襯著肌膚如雪响逢。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,268評論 1 309
  • 那天棕孙,我揣著相機與錄音舔亭,去河邊找鬼些膨。 笑死,一個胖子當(dāng)著我的面吹牛钦铺,可吹牛的內(nèi)容都是我干的订雾。 我是一名探鬼主播,決...
    沈念sama閱讀 40,835評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼职抡,長吁一口氣:“原來是場噩夢啊……” “哼葬燎!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起缚甩,我...
    開封第一講書人閱讀 39,740評論 0 276
  • 序言:老撾萬榮一對情侶失蹤谱净,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后擅威,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體壕探,經(jīng)...
    沈念sama閱讀 46,286評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,375評論 3 340
  • 正文 我和宋清朗相戀三年郊丛,在試婚紗的時候發(fā)現(xiàn)自己被綠了李请。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,505評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡厉熟,死狀恐怖导盅,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情揍瑟,我是刑警寧澤白翻,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站绢片,受9級特大地震影響滤馍,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜底循,卻給世界環(huán)境...
    茶點故事閱讀 41,873評論 3 333
  • 文/蒙蒙 一巢株、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧熙涤,春花似錦阁苞、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,357評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至茸歧,卻和暖如春倦炒,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背软瞎。 一陣腳步聲響...
    開封第一講書人閱讀 33,466評論 1 272
  • 我被黑心中介騙來泰國打工逢唤, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留拉讯,地道東北人。 一個月前我還...
    沈念sama閱讀 48,921評論 3 376
  • 正文 我出身青樓鳖藕,卻偏偏與公主長得像魔慷,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子著恩,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,515評論 2 359

推薦閱讀更多精彩內(nèi)容