ML 模型評(píng)估與選擇(一)

1. 經(jīng)驗(yàn)誤差與過擬合

? ? ? 通常我們把分類錯(cuò)誤的樣本數(shù)占樣本總數(shù)的比例稱為”錯(cuò)誤率“ (error rate)潘靖,即如果在m個(gè)樣本中有a個(gè)樣本分類錯(cuò)誤穿剖,則錯(cuò)誤率E=a/m;相應(yīng)的卦溢,1-a/m稱為“精度”(accuracy).更一般的糊余,我們把在學(xué)習(xí)器的實(shí)際預(yù)測(cè)輸出與樣本的真實(shí)輸出之間的差異稱為“誤差”(error), 學(xué)習(xí)器在訓(xùn)練器上的誤差稱為“訓(xùn)練誤差”(training error)或“經(jīng)驗(yàn)誤差“(empirical error),在新樣本上的誤差稱為“泛化誤差”(generalization error).

? ? ?我們能做的就是將經(jīng)驗(yàn)誤差最小化,在很多情況下单寂,我們可以學(xué)習(xí)得到一個(gè)經(jīng)驗(yàn)誤差贬芥、在訓(xùn)練集上表現(xiàn)很好的分類器,即分類的精度為100%宣决,但是這樣的分類器在多數(shù)情況下都不好蘸劈。學(xué)習(xí)器將訓(xùn)練樣本學(xué)習(xí)的太好了,這樣會(huì)導(dǎo)致泛化能力下降尊沸,這種現(xiàn)象在機(jī)器學(xué)習(xí)中稱“過擬合”(overfitting).

2.評(píng)估方法

? ?一威沫、留出法 ? 留出法(hand-out)直接將數(shù)據(jù)集D劃分成兩個(gè)互斥的集合,其中一個(gè)集合作為訓(xùn)練集S洼专,另外一個(gè)作為測(cè)試集T棒掠。在S上訓(xùn)練出模型后,用T來評(píng)估其測(cè)試誤差屁商,作為對(duì)泛化誤差的估計(jì)烟很。以二分類為例,假設(shè)D包含1000個(gè)樣本蜡镶,將其劃分為S包含700個(gè)樣本溯职,T包含300個(gè)樣本,用S進(jìn)行訓(xùn)練后帽哑,如果模型在T上90個(gè)樣本分類錯(cuò)誤,那么錯(cuò)誤率為30%叹俏,相應(yīng)的妻枕,精度為70%.

?二、交叉驗(yàn)證法 ? “交叉驗(yàn)證法”(cross validation)先將數(shù)據(jù)集D劃分為k個(gè)大小相似的互斥子集,即D=D1∪D2∪...∪Dk屡谐, Di∩Dj =? (i≠j).每個(gè)子集Di都盡可能保持?jǐn)?shù)據(jù)分布的一致性(即從D中分層采樣取得)述么。每次用k-1個(gè)子集作為訓(xùn)練集,余下的那個(gè)子集作為測(cè)試集愕掏;這樣可以獲得k組訓(xùn)練集/測(cè)試集度秘,最終返回的是這k個(gè)測(cè)試結(jié)果的均值。交叉驗(yàn)證法評(píng)估的結(jié)果很大程度上取決于k的取值饵撑,為了強(qiáng)調(diào)這一點(diǎn)剑梳,通常把交叉驗(yàn)證稱“k折交叉驗(yàn)證”。k最常取的值是10.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末滑潘,一起剝皮案震驚了整個(gè)濱河市垢乙,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌语卤,老刑警劉巖追逮,帶你破解...
    沈念sama閱讀 217,657評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異粹舵,居然都是意外死亡钮孵,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門眼滤,熙熙樓的掌柜王于貴愁眉苦臉地迎上來巴席,“玉大人,你說我怎么就攤上這事柠偶∏檠” “怎么了?”我有些...
    開封第一講書人閱讀 164,057評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵诱担,是天一觀的道長(zhǎng)毡证。 經(jīng)常有香客問我,道長(zhǎng)蔫仙,這世上最難降的妖魔是什么料睛? 我笑而不...
    開封第一講書人閱讀 58,509評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮摇邦,結(jié)果婚禮上恤煞,老公的妹妹穿的比我還像新娘。我一直安慰自己施籍,他們只是感情好居扒,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,562評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著丑慎,像睡著了一般遭殉。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上斯棒,一...
    開封第一講書人閱讀 51,443評(píng)論 1 302
  • 那天,我揣著相機(jī)與錄音照弥,去河邊找鬼。 笑死进副,一個(gè)胖子當(dāng)著我的面吹牛这揣,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播影斑,決...
    沈念sama閱讀 40,251評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼给赞,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了鸥昏?” 一聲冷哼從身側(cè)響起塞俱,我...
    開封第一講書人閱讀 39,129評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎吏垮,沒想到半個(gè)月后障涯,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,561評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡膳汪,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,779評(píng)論 3 335
  • 正文 我和宋清朗相戀三年唯蝶,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片遗嗽。...
    茶點(diǎn)故事閱讀 39,902評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡粘我,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出痹换,到底是詐尸還是另有隱情征字,我是刑警寧澤,帶...
    沈念sama閱讀 35,621評(píng)論 5 345
  • 正文 年R本政府宣布娇豫,位于F島的核電站匙姜,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏冯痢。R本人自食惡果不足惜氮昧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,220評(píng)論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望浦楣。 院中可真熱鬧袖肥,春花似錦、人聲如沸振劳。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,838評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽历恐。三九已至寸癌,卻和暖如春选调,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背灵份。 一陣腳步聲響...
    開封第一講書人閱讀 32,971評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留哮洽,地道東北人填渠。 一個(gè)月前我還...
    沈念sama閱讀 48,025評(píng)論 2 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像鸟辅,于是被迫代替她去往敵國(guó)和親氛什。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,843評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容