李宏毅ML02—Where does the error comes from

Where does the error comes from

Bias and Variance

  • error 的來源有兩種—bias(偏差) 和 variance(方差)
  • 偏差和方差.png
  • 由上圖可形象看出“偏差”是樣本擬合出的結(jié)果的期望與樣本真實(shí)結(jié)果的差距大小
  • 而方差是擬合出的結(jié)果表現(xiàn)是否優(yōu)良的穩(wěn)定性串前。

Bias

  • m=\frac{1}{N}\sum\limits_nx^n\neq\mu
  • E[m]=\frac{1}{N}\sum\limits_nE[x^n]=\mu
  • \mu代表客觀存在的真實(shí)值瘫里,m的期望是和\mu相等的
  • 表示在樣本上擬合程度(樣本和真實(shí)情況的偏差)实蔽,low bias 代表在這些樣本上擬合的好荡碾,所以就得復(fù)雜化模型(即,增加參數(shù))局装,容易o(hù)verfitting(即坛吁,high variance)
  • 解決方案:更多的參數(shù),更復(fù)雜的模型
  • 形象化語言:集中容易偏铐尚,分散容易中拨脉;畫的線越貼合樣本值,誤差的點(diǎn)就越散開

Variance

  • Var[m]=\frac{\sigma^2}{N}
  • 那如何得到\sigma^2呢宣增?通過s^2來近似得到
  • s^2=\frac{1}{N}\sum\limits_n(x^n-m)^2
  • E[s^2]=\frac{N-1}{N}\sigma^2
  • s^2的期望會略微小于\sigma^2玫膀,隨著N的增大會越接近
  • 表示在測試集上的表現(xiàn)情況,low variance 代表在測試集上表現(xiàn)穩(wěn)定爹脾,所以就需要簡化模型帖旨,(即,減少參數(shù))灵妨,容易u(yù)nderfitting(即解阅,high bias)
  • 解決方案:更多的訓(xùn)練數(shù)據(jù),正則化
  • Error的來源.png

模型選擇—Cross Validation(交叉驗(yàn)證)

  • 訓(xùn)練集中得到最小的Error(0.5)的model泌霍,并且在測試集上得到了Error最小(0.5)的情況货抄,在真實(shí)場景下,大多數(shù)的情況會比0.5大朱转,所以在實(shí)驗(yàn)室并不能得到一個(gè)在真實(shí)場景下的的error蟹地。
  • 此時(shí)需要把Training Set拆分成Training Set和Validation Set,在Training Set和Validation Set上得到的最小error的值藤为,放到整個(gè)Training Set中測試一遍怪与,得到的error會更加接近真實(shí)情況。甚至可以分成兩個(gè)Training Set和一個(gè)Validation Set凉蜂。
  • k折交叉驗(yàn)證
  • 真實(shí)的情況是琼梆,會有k折交叉驗(yàn)證
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末性誉,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子茎杂,更是在濱河造成了極大的恐慌错览,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,265評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件煌往,死亡現(xiàn)場離奇詭異倾哺,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)刽脖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評論 2 385
  • 文/潘曉璐 我一進(jìn)店門羞海,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人曲管,你說我怎么就攤上這事却邓。” “怎么了院水?”我有些...
    開封第一講書人閱讀 156,852評論 0 347
  • 文/不壞的土叔 我叫張陵腊徙,是天一觀的道長。 經(jīng)常有香客問我檬某,道長撬腾,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,408評論 1 283
  • 正文 為了忘掉前任恢恼,我火速辦了婚禮民傻,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘场斑。我一直安慰自己漓踢,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評論 5 384
  • 文/花漫 我一把揭開白布和簸。 她就那樣靜靜地躺著彭雾,像睡著了一般。 火紅的嫁衣襯著肌膚如雪锁保。 梳的紋絲不亂的頭發(fā)上薯酝,一...
    開封第一講書人閱讀 49,772評論 1 290
  • 那天,我揣著相機(jī)與錄音爽柒,去河邊找鬼吴菠。 笑死,一個(gè)胖子當(dāng)著我的面吹牛浩村,可吹牛的內(nèi)容都是我干的做葵。 我是一名探鬼主播,決...
    沈念sama閱讀 38,921評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼心墅,長吁一口氣:“原來是場噩夢啊……” “哼酿矢!你這毒婦竟也來了榨乎?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,688評論 0 266
  • 序言:老撾萬榮一對情侶失蹤瘫筐,失蹤者是張志新(化名)和其女友劉穎蜜暑,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體策肝,經(jīng)...
    沈念sama閱讀 44,130評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡肛捍,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了之众。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片拙毫。...
    茶點(diǎn)故事閱讀 38,617評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖棺禾,靈堂內(nèi)的尸體忽然破棺而出缀蹄,到底是詐尸還是另有隱情,我是刑警寧澤帘睦,帶...
    沈念sama閱讀 34,276評論 4 329
  • 正文 年R本政府宣布袍患,位于F島的核電站,受9級特大地震影響竣付,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜滞欠,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評論 3 312
  • 文/蒙蒙 一古胆、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧筛璧,春花似錦逸绎、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至朗儒,卻和暖如春颊乘,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背醉锄。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評論 1 265
  • 我被黑心中介騙來泰國打工乏悄, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人恳不。 一個(gè)月前我還...
    沈念sama閱讀 46,315評論 2 360
  • 正文 我出身青樓檩小,卻偏偏與公主長得像,于是被迫代替她去往敵國和親烟勋。 傳聞我的和親對象是個(gè)殘疾皇子规求,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評論 2 348

推薦閱讀更多精彩內(nèi)容