《機器學(xué)習基石》學(xué)習筆記<5>

Why Can Machines Learning?

按例放上學(xué)習進度:D

Roadmap

前面的4課解決了機器能學(xué)習的條件,即when,
現(xiàn)在開始思考機器能學(xué)習的原理。

一旭从、Recap and preview

首先整理下之前get到的知識:P

目前,我們已經(jīng)知道了场仲,當h的個數(shù)M有限時和悦,且N足夠大,A選中的那個g,會有Ein(g)≈Eout(g)(現(xiàn)成資料D里的g的錯誤率可以推出機器預(yù)測未知的資料的出錯率渠缕,并且很接近哦)鸽素;當A選擇的g,Ein(g)≈0的時候,Eout(g)≈0是PAC的亦鳞。Eout(g)≈0,就是說機器是可以學(xué)習的馍忽。
整個flow里可以理解為train(訓(xùn)練已有資料)和test(用新的資料來測試結(jié)果)兩部分。

learning可以說是在bath的D,監(jiān)督式學(xué)習燕差,二元分類器等條件下遭笋,通過保證Ein(g)≈Eout(g)和Ein(g)≈0,使g≈f (Eout(g)≈0)徒探。

那么learning可以分為2個核心問題:

  • Ein(g)≈Eout(g)?
    (M finite瓦呼,N large)
  • Ein(g)≈0?

關(guān)于上面的兩個問題:

  • 如果M很小猖辫,從公式可以推出掷空,P[BAD]小,但是扼睬,選擇也變得小了偷溺,那么不一定找得到Ein(g)≈0的優(yōu)秀線
  • 如果M很大,選擇多了钱贯,可P[BAD]也大了 :(

emmmm……
所以用合適的M超級重要呢~
前面的討論都是M有限的情況挫掏,如果M無限大呢?


解決方案是,用一個有限的m去替換無限的M:)

所以秩命,現(xiàn)在問題變成:怎么找到一個合適的m來替代M?

二尉共、Effective number of lines

先考慮為什么公式在infinite情況下不可行的褒傅?


每種BAD在獨立來看都是不一樣的,但是union bound 后就會有重疊部分袄友,疊加infinite個獨立p后變得無限大殿托,此時就變得無意義了。


BAD重疊可以理解為h1≈h2
總之剧蚣,B1,B2,B3……這些BAD其實是重疊了的支竹,但是union bound公式是沒有考慮重疊的,把每個BAD當成獨立的來計算鸠按,造成了無限大的上限礼搁。所以此時infinite個h是無法計算的。
好嘛目尖,既然是因為重疊了才不可計算馒吴,那就想辦法找出重疊部分:D


先考慮這樣一個問題:
如果平面上只有一個x,那么會有多少條h呢?
顯然是可以分為兩種瑟曲,一種是把x劃分為+1那邊的饮戳,一種是把x劃分到-1那邊的。

那么洞拨,有2個點的時候呢扯罐?

可以根據(jù)把x1,x2劃分到那一邊算出有4種h。
那么3個點的時候呢扣甲?



對的篮赢,8種。
這時候你有一個猜想琉挖,哇启泣,好像是2^n呢……
然而,如果3個點是在一條線上的呢?



emmm……
對的示辈,有的情況無法用一條直線劃分寥茫,所以這時候只有6條h.

當有4個點時,也會出現(xiàn)無法劃分的時候矾麻。


總的來說纱耻,結(jié)論如下:


我們把這種有效的條數(shù)稱為effective number of lines


從1,2,3,4個x可以發(fā)現(xiàn)它們的h總是有個上限的,沒有重疊部分的,最大不會超過2N(每個點的情況都是兩種险耀,所以最多不會超過2N)弄喘。所以,D里面的N個點的最大不會超過2^N條h。
那么是不是可以用effective(N)來替代那個無限的M呢甩牺?

三蘑志、Effective number of Hypotheses

現(xiàn)在引入一個概念dichotomy:
把點x,劃分到+1,-1的集合。


hypotheses H 與dichotomies H(x1,x2,...,Xn)的區(qū)別如圖。
前面說到effective(N)的概念急但,effective(N)正是dichotomies H(x1,x2,...,Xn)的h的個數(shù)呢澎媒。
既然dichotomies H(x1,x2,...,Xn)是沒有重疊部分的,那么可以作為替換M的候選了波桩。


|H(x1,x2,...,Xn)|是依賴x的(比如上面提到的3個x的時候戒努,擺放不同會有不同的結(jié)果,6和8)镐躲,現(xiàn)在我們除去對x的依賴储玫,只討論|H(x1,x2,...,Xn)|的max,把這稱為成長函數(shù)(Growth Function)匀油。
那么缘缚,怎么計算成長函數(shù)呢?

第一種情況:
把直線上一部分劃分為+1,像射線一樣敌蚜,N個點可以把一條線劃分為N+1個塊桥滨,這時有N+1條線可以劃分。

第二種情況:
一部分劃分為+1弛车。
此時N個點還是把線分為N+1塊齐媒,既然是取部分劃分為+1,那么取兩個塊作為線的端點,所以一共Nx(N+1)/2種纷跛,還有一種是全部取為+1喻括,所以
N(N+1)/2+1.

第三種情況:
凸的部分劃分為+1。

此時可以凸邊形做出來 ,即連點贫奠,突邊形外內(nèi)的都是里的都是+1,其他為-1.
所有點都可以這種方法劃分出來唬血,所以是
2^N*.
總結(jié):

四、Break point


通過得到的式子可以看出唤崭,當成長函數(shù)為多項式時效果比較好拷恨,指數(shù)時效果不好。


在二維下谢肾,
3個x時存在shatter(原意打碎腕侄,破壞,在這里可以理解為全部命中芦疏,比如3個x,有8種可能冕杠,存在8種都可行的狀態(tài),即命中),這時有6和8的情況酸茴,所以是'存在'分预。
4個x時不存在shatter,因為最多只有14種。
可以推出薪捍,自4以后都是不存在shatter的噪舀。
假設(shè)k為inputs的個數(shù)魁淳,
當k個inputs讓H不存在shatter時,稱k為break point.
在二維下与倡,4就是break point.
k+1,k+2,k+3……也是break point

五、Summary

總結(jié):

  • 復(fù)習之前4個課程的知識
  • 當M無限大時昆稿,因為union bound是把每個BAD加起來纺座,沒有考慮除去重疊部分造成了無限大,如果用eddective(N)替代M也許能解決這個問題
  • 介紹了4種成長函數(shù)溉潭,其中多項式的替換效果比較好
  • 介紹了break point , 比如4
  • 總的來說解決了M 無限時的情況净响,大題的思路是找出一個有限的且有效的m去替代M,最后,我們找到了多項式的成長函數(shù)來替換

以上:D
注明:以上圖片都來自Cousera臺大林軒田老師的《機器學(xué)習基石》哦 QwQ

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末喳瓣,一起剝皮案震驚了整個濱河市馋贤,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌畏陕,老刑警劉巖配乓,帶你破解...
    沈念sama閱讀 211,376評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異惠毁,居然都是意外死亡犹芹,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評論 2 385
  • 文/潘曉璐 我一進店門鞠绰,熙熙樓的掌柜王于貴愁眉苦臉地迎上來腰埂,“玉大人,你說我怎么就攤上這事蜈膨∮炝” “怎么了?”我有些...
    開封第一講書人閱讀 156,966評論 0 347
  • 文/不壞的土叔 我叫張陵翁巍,是天一觀的道長驴一。 經(jīng)常有香客問我,道長曙咽,這世上最難降的妖魔是什么蛔趴? 我笑而不...
    開封第一講書人閱讀 56,432評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮例朱,結(jié)果婚禮上孝情,老公的妹妹穿的比我還像新娘。我一直安慰自己洒嗤,他們只是感情好箫荡,可當我...
    茶點故事閱讀 65,519評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著渔隶,像睡著了一般羔挡。 火紅的嫁衣襯著肌膚如雪洁奈。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,792評論 1 290
  • 那天绞灼,我揣著相機與錄音利术,去河邊找鬼。 笑死低矮,一個胖子當著我的面吹牛印叁,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播军掂,決...
    沈念sama閱讀 38,933評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼轮蜕,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蝗锥?” 一聲冷哼從身側(cè)響起跃洛,我...
    開封第一講書人閱讀 37,701評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎终议,沒想到半個月后汇竭,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,143評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡痊剖,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,488評論 2 327
  • 正文 我和宋清朗相戀三年韩玩,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片陆馁。...
    茶點故事閱讀 38,626評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡找颓,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出叮贩,到底是詐尸還是另有隱情击狮,我是刑警寧澤,帶...
    沈念sama閱讀 34,292評論 4 329
  • 正文 年R本政府宣布益老,位于F島的核電站彪蓬,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏捺萌。R本人自食惡果不足惜档冬,卻給世界環(huán)境...
    茶點故事閱讀 39,896評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望桃纯。 院中可真熱鬧酷誓,春花似錦、人聲如沸态坦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽伞梯。三九已至玫氢,卻和暖如春帚屉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背漾峡。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工攻旦, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人灰殴。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓敬特,卻偏偏與公主長得像,于是被迫代替她去往敵國和親牺陶。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,494評論 2 348

推薦閱讀更多精彩內(nèi)容