模型評估與選擇

泛化誤差:學(xué)習(xí)器在新樣本上的誤差為泛化誤差一姿。顯然,我們希望得到泛化誤差小的學(xué)習(xí)器和措。

過擬合:學(xué)習(xí)器把訓(xùn)練樣本學(xué)得‘太好’了的時候奴烙,很可能把訓(xùn)練樣自身的一些特點當(dāng)作了所有潛在樣本都會具有的一般性質(zhì)助被,這樣導(dǎo)致泛化性能下降。此現(xiàn)象稱為‘過擬合’缸沃。過擬合是機器學(xué)習(xí)的關(guān)鍵障礙恰起,無法徹底避免修械,只能緩解趾牧。

模型評估方法:有三種。

1.留出法:

將數(shù)據(jù)集D分為訓(xùn)練集S與測試集T肯污,訓(xùn)練集應(yīng)該盡量與測試集互斥翘单,即測試樣本盡量不要在訓(xùn)練集中出現(xiàn)吨枉。S訓(xùn)練出模型后,以T來評估測試誤差哄芜,作為泛化誤差的估計貌亭。數(shù)據(jù)的劃分要保持數(shù)據(jù)分布的一致性。實際中认臊,往往采用若干次隨機劃分圃庭、每次產(chǎn)生一個訓(xùn)練/測試集用于實驗評估,100次就有100個結(jié)果失晴,最后以100次的結(jié)果作為均值剧腻。缺點:有時候由于T太小,模型的評估未必準確涂屁。如果增大T书在,則S與D差別更大,被評估的模型與用D訓(xùn)練出的模型相比可能有比較大的差別拆又,降低了評估結(jié)果的保真性儒旬。

2.交叉驗證法:

將數(shù)據(jù)集D分為k個大小相似的互斥子集。k-1個子集作為訓(xùn)練集帖族、剩下的一個作為測試集栈源。這樣進行k次訓(xùn)練和測試,最終返回k個測試結(jié)果的均值竖般。

存在一個特例:留一法:數(shù)據(jù)集D有m個樣本凉翻,令k=m,留一法不受樣本隨機劃分的影響捻激,所以評估結(jié)果比較準確制轰。但如果數(shù)據(jù)集較大時留一法比較消耗資源,成本過大胞谭。


查準率與查全率:

查準率:被查出來是糖尿病的人有多少是真正的糖尿病患者(鑒別假陽性)垃杖。

查全率:真正的糖尿病人有多少被查了出來(鑒別出沒有被查出的糖尿病患者)。


ROC與AUC:

很多學(xué)習(xí)器是為測試樣本產(chǎn)生一個實值或概率預(yù)測丈屹,然后將這個預(yù)測值與一個分類閾值進行比較调俘,若大于閾值分為正類、小于閾值為反類旺垒。根據(jù)這個實值或概率預(yù)測結(jié)果對樣本進行排序彩库,最可能是正例的排在前面,最不可能是正例的排在后面先蒋。

這樣分類就相當(dāng)于在排序過程中以某個截斷點將樣本分為兩部分骇钦,前一部分判作正例,后一部分作反例竞漾。

所以排序性能的好壞體現(xiàn)了學(xué)習(xí)器泛化性能的好壞眯搭。ROC即是從此角度出發(fā)來研究學(xué)習(xí)器泛化性能的窥翩。對樣例的預(yù)測結(jié)果進行排序,按照排序順序逐個把樣本作為正例進行預(yù)測鳞仙,每次計算出‘真正例率(TPR)’與‘假正例率(FPR)’寇蚊。橫軸為‘假正例率’、縱軸為‘真正例率’棍好。

進行學(xué)習(xí)器比較時若一個學(xué)習(xí)器的ROC曲線被另一個完全包住仗岸,則可斷言后者性能優(yōu)于前者,若兩個學(xué)習(xí)器的roc曲線發(fā)生交叉此時則用ROC曲線下的面積AUC進行判斷借笙。


偏差爹梁、方差、噪聲

泛化誤差可以分解為偏差提澎、方差與噪聲之和姚垃。

偏差度量了學(xué)習(xí)算法的期望預(yù)測與真實結(jié)果的偏離程度,即刻畫了學(xué)習(xí)算法本身的擬合能力

方差度量了同樣大小的訓(xùn)練集的變動所導(dǎo)致的學(xué)習(xí)性能的變化盼忌,即刻畫了數(shù)據(jù)擾動所造成的影響积糯。

噪聲則表達了在當(dāng)前任務(wù)上任何學(xué)習(xí)算法所能達到的期望泛化誤差的下界,即刻畫了學(xué)習(xí)問題的本身難度谦纱,是客觀存在的看成。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市跨嘉,隨后出現(xiàn)的幾起案子川慌,更是在濱河造成了極大的恐慌,老刑警劉巖祠乃,帶你破解...
    沈念sama閱讀 219,539評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件梦重,死亡現(xiàn)場離奇詭異,居然都是意外死亡亮瓷,警方通過查閱死者的電腦和手機琴拧,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評論 3 396
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來嘱支,“玉大人蚓胸,你說我怎么就攤上這事〕Γ” “怎么了沛膳?”我有些...
    開封第一講書人閱讀 165,871評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長汛聚。 經(jīng)常有香客問我锹安,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,963評論 1 295
  • 正文 為了忘掉前任八毯,我火速辦了婚禮搓侄,結(jié)果婚禮上瞄桨,老公的妹妹穿的比我還像新娘话速。我一直安慰自己,他們只是感情好芯侥,可當(dāng)我...
    茶點故事閱讀 67,984評論 6 393
  • 文/花漫 我一把揭開白布泊交。 她就那樣靜靜地躺著,像睡著了一般柱查。 火紅的嫁衣襯著肌膚如雪廓俭。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,763評論 1 307
  • 那天唉工,我揣著相機與錄音研乒,去河邊找鬼。 笑死淋硝,一個胖子當(dāng)著我的面吹牛雹熬,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播谣膳,決...
    沈念sama閱讀 40,468評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼竿报,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了继谚?” 一聲冷哼從身側(cè)響起烈菌,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎花履,沒想到半個月后芽世,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,850評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡诡壁,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,002評論 3 338
  • 正文 我和宋清朗相戀三年捂襟,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片欢峰。...
    茶點故事閱讀 40,144評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡葬荷,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出纽帖,到底是詐尸還是另有隱情宠漩,我是刑警寧澤,帶...
    沈念sama閱讀 35,823評論 5 346
  • 正文 年R本政府宣布懊直,位于F島的核電站扒吁,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏室囊。R本人自食惡果不足惜雕崩,卻給世界環(huán)境...
    茶點故事閱讀 41,483評論 3 331
  • 文/蒙蒙 一魁索、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧盼铁,春花似錦粗蔚、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,026評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至肤寝,卻和暖如春当辐,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背鲤看。 一陣腳步聲響...
    開封第一講書人閱讀 33,150評論 1 272
  • 我被黑心中介騙來泰國打工缘揪, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人义桂。 一個月前我還...
    沈念sama閱讀 48,415評論 3 373
  • 正文 我出身青樓找筝,卻偏偏與公主長得像,于是被迫代替她去往敵國和親澡刹。 傳聞我的和親對象是個殘疾皇子呻征,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,092評論 2 355

推薦閱讀更多精彩內(nèi)容