《機(jī)器學(xué)習(xí)（周志華）》學(xué)習(xí)筆記（二）

Q：怎樣評(píng)估一個(gè)學(xué)習(xí)算法訓(xùn)練出來(lái)的學(xué)習(xí)器的效果好壞温艇？

評(píng)估學(xué)習(xí)器的基本要求是：

學(xué)習(xí)器誤差越小越好。對(duì)于分類任務(wù)幔戏，分類錯(cuò)誤的樣本數(shù)占總樣本數(shù)的比率越小越好啼器。對(duì)于回歸預(yù)測(cè)旬渠，預(yù)測(cè)值與真實(shí)值的差越小越好。
學(xué)習(xí)器泛化能力越強(qiáng)越好端壳。也就是說(shuō)學(xué)習(xí)能力不僅在訓(xùn)練樣本上要表現(xiàn)好告丢，在新的樣本上的表現(xiàn)也要好。不能像書(shū)呆子一樣在學(xué)校表現(xiàn)很好损谦，但一進(jìn)入社會(huì)就一塌糊涂岖免。

因此岳颇，評(píng)估一個(gè)學(xué)習(xí)器，我們通常首先要衡量它的泛化誤差颅湘，也就是一個(gè)訓(xùn)練好的學(xué)習(xí)器在新樣本上的誤差表現(xiàn)话侧。

Q：當(dāng)只有一個(gè)數(shù)據(jù)集，并且既要訓(xùn)練闯参，又要測(cè)試的時(shí)候瞻鹏，怎么辦？

可以想象人類學(xué)生的做法鹿寨。當(dāng)人類學(xué)生準(zhǔn)備高考新博、或者考研、或者其他考試的時(shí)候脚草，刷題總是必不可少的學(xué)習(xí)過(guò)程赫悄。當(dāng)我們只有一套試卷的時(shí)候，我們總是用一部分試卷來(lái)學(xué)習(xí)（也就是一邊做題馏慨，一邊翻書(shū)埂淮，通過(guò)做題來(lái)梳理知識(shí)和查缺補(bǔ)漏），然后另外一部分試卷用來(lái)真正地測(cè)試自己的能力（全程做題熏纯，做完再對(duì)答案）同诫。機(jī)器學(xué)習(xí)的做法也一樣粤策。

留出法：當(dāng)只有一個(gè)數(shù)據(jù)集的時(shí)候樟澜，用一部分來(lái)訓(xùn)練，一部分來(lái)測(cè)試叮盘。而且訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)沒(méi)有交集秩贰。通常會(huì)用60%到80%的數(shù)據(jù)作為訓(xùn)練集，剩下的作為測(cè)試集柔吼。需要注意的是毒费，在選擇訓(xùn)練集（或者測(cè)試集）的時(shí)候要采用分層抽樣的方法。就像刷題一樣愈魏，訓(xùn)練集和測(cè)試集都要有相近比例的題型觅玻，不能訓(xùn)練集全是選擇題，測(cè)試集全是論述題培漏，應(yīng)該訓(xùn)練集和測(cè)試集都包含選擇題和測(cè)試題溪厘，而且比例要一致，都是八成選擇題牌柄，兩成論述題畸悬。

一次的訓(xùn)練-測(cè)試結(jié)果可能不夠科學(xué)，最好劃分不同的訓(xùn)練集和測(cè)試集珊佣，做多次訓(xùn)練-測(cè)試蹋宦，將測(cè)試結(jié)果（錯(cuò)誤率披粟、查準(zhǔn)率之類的）取平均。

交叉檢驗(yàn)法：這是在“留出法”的基礎(chǔ)上改進(jìn)的方法冷冗。先將數(shù)據(jù)集分為k個(gè)大小相似的互斥子集（當(dāng)然守屉，每個(gè)子集的產(chǎn)生都要用分層抽樣進(jìn)行）。每次用k-1個(gè)子集作為訓(xùn)練集蒿辙，剩下的一個(gè)作為測(cè)試集胸梆。這樣就可以進(jìn)行k次訓(xùn)練-測(cè)試。k的測(cè)試結(jié)果的平均值就是最終的測(cè)試結(jié)果须板。

自助法：上述兩種方法都是在原本作為訓(xùn)練集的數(shù)據(jù)中抽出一部分作為測(cè)試集碰镜，因此訓(xùn)練集的規(guī)模不可避免地減少了，訓(xùn)練效果也就受到了影響习瑰。自助法則是一種比較好的緩解方法绪颖。假設(shè)有一個(gè)包含m個(gè)樣本的數(shù)據(jù)集D。對(duì)這個(gè)數(shù)據(jù)集進(jìn)行m次有放回的抽樣甜奄，則得到了一個(gè)含有m個(gè)樣本的數(shù)據(jù)集D'柠横。D'相對(duì)于原數(shù)據(jù)集D，規(guī)模沒(méi)有減少课兄，只是D'中有部分樣本是重復(fù)出現(xiàn)的牍氛。所以在抽樣中沒(méi)有抽到的樣本就作為測(cè)試集，D'就作為訓(xùn)練集烟阐。按照概率論推導(dǎo)可知搬俊，一般來(lái)說(shuō)抽樣中國(guó)會(huì)有三分之一的樣本沒(méi)有被抽到，也就是說(shuō)測(cè)試集大小為數(shù)據(jù)集D大小的三分之一蜒茄。

雖然自助法能彌補(bǔ)留出法和交叉檢驗(yàn)法的不足唉擂，但是也有自己的缺陷，那就是改變了原來(lái)的訓(xùn)練樣本的分布檀葛，這也會(huì)對(duì)訓(xùn)練效果造成影響玩祟。因此在數(shù)據(jù)集比較大時(shí)多采用留出法和交叉檢驗(yàn)法，當(dāng)數(shù)據(jù)集比較小時(shí)采用自助法屿聋。

Q：在測(cè)試一個(gè)學(xué)習(xí)器時(shí)空扎，有哪些測(cè)試指標(biāo)可以使用？

錯(cuò)誤率(error)：最常用的測(cè)試指標(biāo)就是錯(cuò)誤率润讥。對(duì)于一次分類任務(wù)转锈，如果分類錯(cuò)誤的樣本數(shù)為a，總樣本數(shù)為m象对，則錯(cuò)誤率E=a/m.（精度為1-a/m）黑忱。比如為100個(gè)西瓜分類，有10個(gè)分錯(cuò)了，錯(cuò)誤率就是10%甫煞。

均方誤差(mean squared error)：“錯(cuò)誤率”一般針對(duì)分類任務(wù)菇曲，回歸預(yù)測(cè)則用均方誤差，即各次抚吠，預(yù)測(cè)值與真實(shí)值常潮，的差，的平方楷力，的和： $\sum_{i=1}^n (y_預(yù) - y_真)^2$ 可以認(rèn)為是各次預(yù)測(cè)的誤差的累加喊式。

查準(zhǔn)率(precision)：也就是檢索出來(lái)的結(jié)果中準(zhǔn)確的結(jié)果所占的比例。比如找出100個(gè)西瓜中的好瓜萧朝，找出50個(gè)岔留，但這50個(gè)中只有40個(gè)是真正的好瓜，則查準(zhǔn)率為80%检柬。

查全率(recall)：也就是希望檢索的結(jié)果中被檢索出來(lái)的比例献联。比如找出100個(gè)西瓜中的好瓜，找出40個(gè)何址，但真正的好瓜有50個(gè)里逆，則查全率為80%。

ROC曲線：很多二分類學(xué)習(xí)器的分類方法是計(jì)算出每一個(gè)樣本作為正例的概率用爪，然后按照概率大小對(duì)樣本排序原押，最后確定一個(gè)臨界概率（閾值），大于臨界概率的認(rèn)定為正例偎血，其余為反例诸衔。以西瓜分類為例。有些西瓜是好瓜的概率高烁巫，有些西瓜是好瓜的概率低署隘。把這些西瓜按照概率排序宠能，然后取50%作為臨界概率亚隙。概率大于50%的認(rèn)為是好瓜，否則為壞瓜违崇。因此這個(gè)排序的質(zhì)量很重要阿弃。

使用這種方法就會(huì)產(chǎn)生兩個(gè)指標(biāo)：真正例率（“選出的好瓜”中真正的好瓜占所有的好瓜的比例，也就是好瓜的查準(zhǔn)率）羞延，和假正例率（“選出的好瓜”中壞瓜占所有壞瓜的比例）渣淳。對(duì)于每一個(gè)臨界概率，都有一個(gè)對(duì)應(yīng)的真正例率和假正例率伴箩。把各個(gè)臨界概率對(duì)應(yīng)的真正例率和假正例率繪成圖就是ROC圖入愧。

AUC

AUC：Area Under Curve 就是ROC曲線中右下方區(qū)域的面積。AUC判斷一個(gè)分類用的排序隊(duì)列的好壞，AUC越大越好棺蛛。

Q：知道了兩個(gè)學(xué)習(xí)器的某個(gè)指標(biāo)怔蚌，比如錯(cuò)誤率，A學(xué)習(xí)器的錯(cuò)誤率低于B學(xué)習(xí)器的錯(cuò)誤率旁赊，能否認(rèn)為A學(xué)習(xí)器質(zhì)量比B學(xué)習(xí)器好桦踊？

不能。

首先一次的測(cè)試結(jié)果可能有誤差终畅，需要多次測(cè)試然后取平均籍胯。所以應(yīng)該比較平均錯(cuò)誤率。其次一個(gè)學(xué)習(xí)器的平均錯(cuò)誤率比另一個(gè)的低离福，這個(gè)是否顯著杖狼？若某一次評(píng)估中A學(xué)習(xí)器的平均錯(cuò)誤率是2%，B學(xué)習(xí)器的平均錯(cuò)誤率是2.001%妖爷，能否就能說(shuō)明A的性能比B好本刽？

若要比較兩個(gè)學(xué)習(xí)器的某項(xiàng)指標(biāo)，要用到統(tǒng)計(jì)學(xué)的假設(shè)檢驗(yàn)赠涮，才能得到有顯著性的子寓，盡可能排除偶然性的結(jié)論。比如用ｔ檢驗(yàn)比較兩個(gè)學(xué)習(xí)器的平均錯(cuò)誤率笋除，用方差分析和多重比較來(lái)比較多個(gè)學(xué)習(xí)器的某項(xiàng)性能斜友。

本作品首發(fā)于簡(jiǎn)書(shū) 和博客園平臺(tái)，采用知識(shí)共享署名 4.0 國(guó)際許可協(xié)議進(jìn)行許可垃它。

最后編輯于：2020.06.11 15:26:50

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末鲜屏，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子国拇，更是在濱河造成了極大的恐慌洛史，老刑警劉巖，帶你破解...
沈念sama閱讀 211,042評(píng)論 6贊 490
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件酱吝，死亡現(xiàn)場(chǎng)離奇詭異也殖，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)务热，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 89,996評(píng)論 2贊 384
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門忆嗜，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人崎岂，你說(shuō)我怎么就攤上這事捆毫。” “怎么了冲甘？”我有些...
開(kāi)封第一講書(shū)人閱讀 156,674評(píng)論 0贊 345
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵绩卤，是天一觀的道長(zhǎng)途样。經(jīng)常有香客問(wèn)我，道長(zhǎng)濒憋，這世上最難降的妖魔是什么娘纷？我笑而不...
開(kāi)封第一講書(shū)人閱讀 56,340評(píng)論 1贊 283
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮跋炕，結(jié)果婚禮上赖晶，老公的妹妹穿的比我還像新娘。我一直安慰自己辐烂，他們只是感情好遏插，可當(dāng)我...
茶點(diǎn)故事閱讀 65,404評(píng)論 5贊 384
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著纠修，像睡著了一般胳嘲。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上扣草，一...
開(kāi)封第一講書(shū)人閱讀 49,749評(píng)論 1贊 289
城市分裂傳說(shuō)
那天了牛，我揣著相機(jī)與錄音，去河邊找鬼辰妙。笑死鹰祸，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的密浑。我是一名探鬼主播蛙婴，決...
沈念sama閱讀 38,902評(píng)論 3贊 405
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼尔破！你這毒婦竟也來(lái)了街图？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 37,662評(píng)論 0贊 266
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤懒构，失蹤者是張志新（化名）和其女友劉穎餐济，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體胆剧，經(jīng)...
沈念sama閱讀 44,110評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡絮姆，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,451評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了赞赖。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片滚朵。...
茶點(diǎn)故事閱讀 38,577評(píng)論 1贊 340
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖前域，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情韵吨，我是刑警寧澤匿垄，帶...
沈念sama閱讀 34,258評(píng)論 4贊 328
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級(jí)特大地震影響椿疗，放射性物質(zhì)發(fā)生泄漏漏峰。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,848評(píng)論 3贊 312
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一届榄、第九天我趴在偏房一處隱蔽的房頂上張望浅乔。院中可真熱鬧，春花似錦铝条、人聲如沸靖苇。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,726評(píng)論 0贊 21
一樁弒父案班缰，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)贤壁。三九已至，卻和暖如春埠忘，著一層夾襖步出監(jiān)牢的瞬間脾拆，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 31,952評(píng)論 1贊 264
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工莹妒，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留名船，地道東北人。一個(gè)月前我還...
沈念sama閱讀 46,271評(píng)論 2贊 360
代替公主和親
正文我出身青樓旨怠，卻偏偏與公主長(zhǎng)得像包帚，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子运吓，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,452評(píng)論 2贊 348

《機(jī)器學(xué)習(xí)（周志華）》學(xué)習(xí)筆記（二）

Q：怎樣評(píng)估一個(gè)學(xué)習(xí)算法訓(xùn)練出來(lái)的學(xué)習(xí)器的效果好壞温艇？

Q：當(dāng)只有一個(gè)數(shù)據(jù)集，并且既要訓(xùn)練闯参，又要測(cè)試的時(shí)候瞻鹏，怎么辦？

Q：在測(cè)試一個(gè)學(xué)習(xí)器時(shí)空扎，有哪些測(cè)試指標(biāo)可以使用？

Q：知道了兩個(gè)學(xué)習(xí)器的某個(gè)指標(biāo)怔蚌，比如錯(cuò)誤率，A學(xué)習(xí)器的錯(cuò)誤率低于B學(xué)習(xí)器的錯(cuò)誤率旁赊，能否認(rèn)為A學(xué)習(xí)器質(zhì)量比B學(xué)習(xí)器好桦踊？

推薦閱讀更多精彩內(nèi)容