機(jī)器學(xué)習(xí)09 模型性能仇味，選擇與泛化能力

到現(xiàn)在為止呻顽，我們介紹了一些分類回歸的模型，當(dāng)然還有許許多多的模型沒(méi)有介紹丹墨，同時(shí)我們到現(xiàn)在還沒(méi)有對(duì)數(shù)據(jù)有過(guò)任何的加工廊遍，真實(shí)情況下，數(shù)據(jù)是需要清洗提煉贩挣，特征也是需要挖掘和選擇的喉前。這些我們暫時(shí)先不討論没酣。我們假設(shè)我們拿到的就是比較干凈的數(shù)據(jù)，我們通過(guò)合適的模型被饿，實(shí)現(xiàn)了分類或回歸四康，那我們要如何判斷模型的好壞呢？

模型性能的度量

首先我們需要去定義一些標(biāo)準(zhǔn)去衡量我們模型的好壞狭握，比如同一個(gè)分類問(wèn)題闪金，我們拿LR也可以分類，SVM也可以分類论颅，如何去判斷模型的好壞哎垦，其實(shí)需要根據(jù)具體的使用場(chǎng)景。但首先恃疯，我們肯定需要一些指標(biāo)去衡量漏设，不同的場(chǎng)景，選擇不同的指標(biāo)即可今妄。這篇會(huì)簡(jiǎn)單介紹一些常用的度量指標(biāo)郑口。

（1）錯(cuò)誤率與精度

分類問(wèn)題中，錯(cuò)誤率就是指被誤分類的概率盾鳞， $e = \frac{1}{N} \sum_{i=1}^N1(f(x_i)\neq y_i)$

精度是指被正確分類的概率犬性，顯然? $p = 1 - e$

（2）但如果我們想看分類為正的樣本內(nèi)，真實(shí)為正的概率腾仅，那錯(cuò)誤率與精度是不能滿足需求的乒裆，這兩個(gè)指標(biāo)有它的局限性，這時(shí)候我們引入一個(gè)混淆矩陣

混淆矩陣推励，摘自周志華-機(jī)器學(xué)習(xí)

由此我們可以新定義一些指標(biāo)：

精確率? $P = \frac {TP}{TP+FP}$ 鹤耍，預(yù)測(cè)為正的樣本，真實(shí)為正的概率验辞。

召回率? $R = \frac {TP}{TP+FN}$ 稿黄，多少正樣本被預(yù)測(cè)為了正。

這兩個(gè)指標(biāo)往往是一對(duì)矛盾的指標(biāo)受神，比如全部預(yù)測(cè)為正抛猖，那召回率就會(huì)很高，但精確率就會(huì)比較低鼻听。除非是一些比較容易的任務(wù)财著。

$F_1 = \frac {2PR} {P+R} = \frac {2 * TP} {樣本數(shù)+TP-TN}$

$F_1$ 綜合考慮了精確率和召回率，往往作為用來(lái)評(píng)判模型的好壞的標(biāo)準(zhǔn)撑碴。

但是在一些場(chǎng)景下撑教，精確率和召回率側(cè)重點(diǎn)是不一樣的，有時(shí)候精確率重要一些醉拓，有時(shí)候召回率重要一些

這時(shí)候可以引入一個(gè)權(quán)重系數(shù)β

$F_{\beta} = \frac {(1 + \beta^2)PR} {\beta^2P+R}$

$\beta$ 度量了召回率對(duì)精確率的相對(duì)重要性伟姐，? $\beta = 1$ 的時(shí)候收苏，就是 $F_1$ ， $\beta > 1$ 的時(shí)候愤兵，召回率更重要鹿霸，? $\beta < 1$ 的時(shí)候，精確率更重要秆乳。

（3）接下來(lái)是ROC與AUC懦鼠，正如之前所介紹的，很多模型是軟分類屹堰，即給出相應(yīng)的預(yù)測(cè)概率肛冶，然后將預(yù)測(cè)概率和分類閾值（例如0.5）比較，進(jìn)行分類扯键。

借助混淆矩陣睦袖，我們需要新定義兩個(gè)指標(biāo)，分別是真正例率（TPR）和假正例率（FPR）

$TPR = \frac{TP}{TP+FN}$

$FPR = \frac{FP}{TN+FP}$

這個(gè)ROC曲線怎么理解呢荣刑，假設(shè)我們有N個(gè)樣本馅笙，所有樣本都對(duì)應(yīng)著一個(gè)概率，將其從大到小排序 $p_1,p_2,...,p_{N}$ 厉亏。我們將分類閾值從概率最大值慢慢往下降延蟹，

一開(kāi)始分類閾值無(wú)窮大，則TPR和FPR都是0叶堆，就是原點(diǎn)，然后將分類閾值慢慢下調(diào)斥杜，先降到p1,再降到p2虱颗，依次往下降。每一次下降蔗喂，都會(huì)有一個(gè)樣本預(yù)測(cè)從負(fù)樣本變成正樣本忘渔，即每次都可以算出當(dāng)前的TPR和FPR，就可以在圖上相應(yīng)的描點(diǎn)缰儿，最后當(dāng)閾值為 $p_{N}$ 的時(shí)候畦粮，所有樣本都是正的， TPR和FPR都是1了乖阵。把所有N+1個(gè)點(diǎn)連起來(lái)宣赔，就是ROC曲線了。ROC曲線的面積瞪浸，就是AUC儒将。可以拿AUC的大小作為模型評(píng)判的好壞对蒲。

ROC-AUC钩蚊，摘自周志華-機(jī)器學(xué)習(xí)

過(guò)擬合與模型選擇

我們始終要面臨一個(gè)模型選擇的問(wèn)題贡翘，如果一味追求樣本內(nèi)的預(yù)測(cè)能力，所選的模型往往會(huì)比較復(fù)雜砰逻，這就是過(guò)擬合鸣驱，過(guò)擬合的模型，對(duì)于測(cè)試集樣本會(huì)有比較大的測(cè)試誤差蝠咆，是我們要避免的踊东。接下來(lái)介紹兩種模型選擇的方法：正則化與交叉驗(yàn)證。

(1)正則化

這個(gè)方法我們?cè)诰€性回歸中做過(guò)介紹了勺美，就是給參數(shù)增加懲罰系數(shù)递胧，懲罰系數(shù)越大，模型就越趨于簡(jiǎn)單赡茸，越不會(huì)過(guò)擬合缎脾，但可能就會(huì)導(dǎo)致欠擬合了。

(2)交叉驗(yàn)證

簡(jiǎn)單的交叉驗(yàn)證：即將訓(xùn)練數(shù)據(jù)集按比例隨機(jī)劃分成兩部分占卧，訓(xùn)練集和測(cè)試集遗菠，用訓(xùn)練集訓(xùn)練模型，再根據(jù)測(cè)試集的結(jié)果選擇模型

k折交叉驗(yàn)證：講訓(xùn)練數(shù)據(jù)切分為k份华蜒，每次拿k-1份學(xué)習(xí)模型辙纬，剩下的1份當(dāng)做測(cè)試集，可以重復(fù)進(jìn)行k次叭喜，將每次的結(jié)果平均贺拣，選擇最好的那個(gè)模型

留一交叉驗(yàn)證： k折交叉驗(yàn)證的極限情況，分為N份數(shù)據(jù)捂蕴，每次留一個(gè)樣本作為測(cè)試集譬涡，往往是數(shù)據(jù)比較少的時(shí)候用。如果數(shù)據(jù)多的時(shí)候使用啥辨，學(xué)習(xí)時(shí)間會(huì)很長(zhǎng)涡匀。

模型的泛化能力

正如上面所講，我們關(guān)心的是模型的泛化能力溉知，樣本內(nèi)精確度很高不一定可信陨瘩，因?yàn)榭赡苁沁^(guò)擬合的，我們希望模型在預(yù)測(cè)新樣本時(shí)级乍，能有很好的能力舌劳。

模型的泛化誤差，可以分解為偏差卡者，方差和噪聲蒿囤。

（1）偏差度量了學(xué)習(xí)算法的期望預(yù)測(cè)和真實(shí)結(jié)果的偏離程度，刻畫了模型本身的擬合能力崇决。例如一個(gè)二次項(xiàng)回歸材诽，拿一次項(xiàng)擬合底挫，擬合的誤差始終會(huì)比較大×辰模或者說(shuō)模型加了太大的懲罰項(xiàng)建邓，模型欠擬合。

（2）方差度量了同樣大小的訓(xùn)練集變動(dòng)導(dǎo)致的模型的變化睁枕，刻畫了數(shù)據(jù)擾動(dòng)的影響官边。例如一個(gè)二次項(xiàng)回歸，拿更高次去擬合外遇，在當(dāng)前樣本內(nèi)可以擬合的很好注簿，但換一個(gè)同分布的數(shù)據(jù)集，結(jié)果就會(huì)變得很差跳仿，因?yàn)檫^(guò)擬合了诡渴。

（3）噪聲刻畫了泛化誤差的下界，這個(gè)比較好理解菲语。

所以要取得好的泛化性能妄辩，需要較小的偏差與較小的方差。（欠擬合是太大的偏差山上，過(guò)擬合是太大的方差）

下一篇開(kāi)始眼耀，會(huì)介紹集成學(xué)習(xí)，將很多基模型組合成一個(gè)模型佩憾，可以很好的提升模型的性能哮伟。

最后編輯于：2020.05.18 00:04:30

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市妄帘，隨后出現(xiàn)的幾起案子澈吨，更是在濱河造成了極大的恐慌，老刑警劉巖寄摆，帶你破解...
沈念sama閱讀 216,470評(píng)論 6贊 501
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異修赞，居然都是意外死亡婶恼，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,393評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門柏副，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)勾邦，“玉大人，你說(shuō)我怎么就攤上這事割择【炱” “怎么了？”我有些...
開(kāi)封第一講書人閱讀 162,577評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵荔泳，是天一觀的道長(zhǎng)蕉饼。經(jīng)常有香客問(wèn)我虐杯，道長(zhǎng)，這世上最難降的妖魔是什么昧港？我笑而不...
開(kāi)封第一講書人閱讀 58,176評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任擎椰，我火速辦了婚禮，結(jié)果婚禮上创肥，老公的妹妹穿的比我還像新娘达舒。我一直安慰自己，他們只是感情好叹侄，可當(dāng)我...
茶點(diǎn)故事閱讀 67,189評(píng)論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布巩搏。她就那樣靜靜地躺著，像睡著了一般趾代。火紅的嫁衣襯著肌膚如雪贯底。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書人閱讀 51,155評(píng)論 1贊 299
城市分裂傳說(shuō)
那天稽坤，我揣著相機(jī)與錄音丈甸，去河邊找鬼。笑死尿褪，一個(gè)胖子當(dāng)著我的面吹牛睦擂，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播杖玲，決...
沈念sama閱讀 40,041評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼顿仇，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了摆马？” 一聲冷哼從身側(cè)響起臼闻，我...
開(kāi)封第一講書人閱讀 38,903評(píng)論 0贊 274
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎囤采，沒(méi)想到半個(gè)月后述呐，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,319評(píng)論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡蕉毯，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,539評(píng)論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年乓搬，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片代虾。...
茶點(diǎn)故事閱讀 39,703評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡进肯，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出棉磨，到底是詐尸還是另有隱情江掩，我是刑警寧澤，帶...
沈念sama閱讀 35,417評(píng)論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站环形，受9級(jí)特大地震影響策泣，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜斟赚，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,013評(píng)論 3贊 325
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一着降、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧拗军，春花似錦任洞、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書人閱讀 31,664評(píng)論 0贊 22
一樁弒父案交掏，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至刃鳄，卻和暖如春盅弛，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背叔锐。一陣腳步聲響...
開(kāi)封第一講書人閱讀 32,818評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工挪鹏，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人愉烙。一個(gè)月前我還...
沈念sama閱讀 47,711評(píng)論 2贊 368
代替公主和親
正文我出身青樓讨盒，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親步责。傳聞我的和親對(duì)象是個(gè)殘疾皇子返顺，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,601評(píng)論 2贊 353