跟我一起學(xué)scikit-learn08:過擬合和欠擬合

過擬合:是指模型能很好地擬合訓(xùn)練樣本,但對新數(shù)據(jù)的預(yù)測準(zhǔn)確性很差拂酣。
欠擬合:是指模型不能很好地擬合訓(xùn)練樣本秋冰,且對新數(shù)據(jù)的預(yù)測準(zhǔn)確性也不好。
我們來看一個簡單的例子婶熬。首先剑勾,生成一個20個點(diǎn)的訓(xùn)練樣本:

%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
n_dots = 20=
x = np.linspace(0, 1, n_dots)                   # [0, 1] 之間創(chuàng)建 20 個點(diǎn)
y = np.sqrt(x) + 0.2*np.random.rand(n_dots) - 0.1

訓(xùn)練樣本是y=\sqrt{x}+r,其中r是[-0.1,0.1]之間的一個隨機(jī)數(shù)赵颅。
然后分別用一階多項式虽另、三階多項式和十階多項式3個模型來擬合這個數(shù)據(jù)集,得到的結(jié)果如下圖所示性含。

def plot_polynomial_fit(x, y, order):
    p = np.poly1d(np.polyfit(x, y, order))
    # 畫出擬合出來的多項式所表達(dá)的曲線以及原始的點(diǎn)
    t = np.linspace(0, 1, 200)
    plt.plot(x, y, 'ro', t, p(t), '-', t, np.sqrt(t), 'r--')
    return p

plt.figure(figsize=(18, 4))
titles = ['Under Fitting', 'Fitting', 'Over Fitting']
models = [None, None, None]
for index, order in enumerate([1, 3, 10]):
    plt.subplot(1, 3, index + 1)
    models[index] = plot_polynomial_fit(x, y, order)
    plt.title(titles[index], fontsize=20)

figure3_1.png

說明:圖中的點(diǎn)是我們生成的20個訓(xùn)練樣本洲赵;虛線是實際的模型;實線是用訓(xùn)練樣本擬合出來的模型。
在上圖中叠萍,左邊是欠擬合(underfitting)芝发,也稱為高偏差(high bias),因為我們試圖用一條直線來擬合樣本數(shù)據(jù)苛谷。右邊是過擬合(overfitting)辅鲸,也稱為高方差(high variance),用了十階多項式來擬合數(shù)據(jù)腹殿,雖然模型對現(xiàn)有的數(shù)據(jù)集擬合得很好独悴,但對新數(shù)據(jù)預(yù)測誤差卻很大。只有中間的模型較好地擬合了數(shù)據(jù)集锣尉,可以看到虛線和實線基本重合刻炒。
通過本節(jié)的介紹,我們對欠擬合(高偏差)和過擬合(高方差)有了較為直觀地認(rèn)識自沧。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末坟奥,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子拇厢,更是在濱河造成了極大的恐慌爱谁,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,406評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件孝偎,死亡現(xiàn)場離奇詭異访敌,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)衣盾,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,732評論 3 393
  • 文/潘曉璐 我一進(jìn)店門寺旺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人雨效,你說我怎么就攤上這事迅涮。” “怎么了徽龟?”我有些...
    開封第一講書人閱讀 163,711評論 0 353
  • 文/不壞的土叔 我叫張陵叮姑,是天一觀的道長。 經(jīng)常有香客問我据悔,道長传透,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,380評論 1 293
  • 正文 為了忘掉前任极颓,我火速辦了婚禮朱盐,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘菠隆。我一直安慰自己兵琳,他們只是感情好狂秘,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,432評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著躯肌,像睡著了一般者春。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上清女,一...
    開封第一講書人閱讀 51,301評論 1 301
  • 那天钱烟,我揣著相機(jī)與錄音,去河邊找鬼嫡丙。 笑死拴袭,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的曙博。 我是一名探鬼主播拥刻,決...
    沈念sama閱讀 40,145評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼父泳!你這毒婦竟也來了泰佳?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,008評論 0 276
  • 序言:老撾萬榮一對情侶失蹤尘吗,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后浇坐,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體睬捶,經(jīng)...
    沈念sama閱讀 45,443評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,649評論 3 334
  • 正文 我和宋清朗相戀三年近刘,在試婚紗的時候發(fā)現(xiàn)自己被綠了擒贸。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,795評論 1 347
  • 序言:一個原本活蹦亂跳的男人離奇死亡觉渴,死狀恐怖介劫,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情案淋,我是刑警寧澤座韵,帶...
    沈念sama閱讀 35,501評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站踢京,受9級特大地震影響誉碴,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜瓣距,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,119評論 3 328
  • 文/蒙蒙 一黔帕、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蹈丸,春花似錦成黄、人聲如沸呐芥。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,731評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽思瘟。三九已至,卻和暖如春厦取,著一層夾襖步出監(jiān)牢的瞬間潮太,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,865評論 1 269
  • 我被黑心中介騙來泰國打工虾攻, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留铡买,地道東北人。 一個月前我還...
    沈念sama閱讀 47,899評論 2 370
  • 正文 我出身青樓霎箍,卻偏偏與公主長得像奇钞,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子漂坏,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,724評論 2 354

推薦閱讀更多精彩內(nèi)容