PAC-learning

PAD-learnable的 定義:?

P(Rs(h(x))>=?)<=δ

* 存在對應(yīng)的其中是樣本的數(shù)量抒痒,代表樣本的分布代表樣本空間

* 存在對應(yīng)的Dm,其中,m是樣本的數(shù)量,D代表樣本的分布.Dm代表樣本空間.

如何理解: 用概率學(xué)的理論解釋, 就是R(x) (錯誤樣本)可以控制在一定的概率范圍內(nèi). 在m 個樣本中隨機取m * epsilon 次袁串,至少有一次錯誤的可能性小于delta.

c(x): 規(guī)則定義空間,需要學(xué)習(xí)的空間

h(x): 假設(shè)空間, 學(xué)習(xí)到的空間

將c(x) 具象化: 如果是一個矩形區(qū)域,落在矩形區(qū)域內(nèi)的點為1靶累,否則為0. 可以推導(dǎo)得出該c(x) 是否是PAC-learning可學(xué)習(xí)的敏释,以及在什么情況下可學(xué)習(xí).

假設(shè)R1(x)為h(x) 假設(shè)空間, R(x)為定義空間晤硕,ri(x) 為h(x) 外且在c(x)內(nèi)的4個矩形內(nèi)的點.


也就是說:所有的樣本都掉入了誤差區(qū)域悼潭。?


因為誤差區(qū)域又是一個矩形c(x),?可以通過嵌套的方式得出:P(R(ri))>=?

4(1-?m/4)^m<=4exp(??m/4)[較常用的不等式]

最終可以得出結(jié)論: 如果要保證PAC-learning: 需要滿足:

m>=4/?log(δ/4)

這也揭示了機器學(xué)習(xí)達到一定的性能, 需要的樣本量與定義空間之間的關(guān)系.

另一個例子:

如果c(x) 不是矩形區(qū)域,而是圓形區(qū)域會怎樣呢舞箍,這是本書的練習(xí)題舰褪,可以證明為PAC-learning的,滿足

m>=1/?log(δ)

證明如下:

假設(shè)R(x)為定義空間, R1(x)為假設(shè)空間h(x), r(x) 為R1(x) 外且在R(x) 內(nèi)的r(x)環(huán)形內(nèi)的點.

P(Rs(R(x))>=?)=P(R1(x)∩r1=Φ)=P(r1)

由于r1為環(huán)形區(qū)域,面積小于圓形區(qū)域.

有P(r1)<(1??)m<=exp(?m?) 故有:m>=1/?log(δ)

下面討論c(x)定義空間的學(xué)習(xí)邊界.

有限邊界定義空間

何為有限邊界疏橄,可以這么理解, 就是有N個函數(shù)定義的規(guī)則空間. 前提占拍,N個規(guī)則空間都是滿足PAC-learning的.

比如有N個矩形,N個圓, c(x) 可以用N個函數(shù)定義出來. 這里我們用|H|表示函數(shù)的數(shù)量. 那么捎迫,滿足什么條件晃酒,就可以 PAC-learning,條件是:

m>=1/?(log|H|+log1/δ)

根據(jù)公式看一下窄绒,樣本空間的大小取決于這定義空間有多復(fù)雜(|H|), 以及需要多高的準(zhǔn)確率(epsilon越小贝次,準(zhǔn)確率越高), 可以假設(shè),當(dāng)|H|無限大時, PAC-learning就不可達到了.

證明方法就是這|H|個規(guī)則空間的疊加.


c(x)的表示

本書中用一個例子展示出一個concept集的表示對于學(xué)習(xí)的重要性彰导。這里列舉了K-CNF 庫克公式的例子.

怎么理解K-CNF公式呢蛔翅?先給出K-CNF的定義:

假設(shè)concept可以由k組表示得到,u0?k. 那么就可以寫成∪u0?k.

對于一個單獨的位谋,又可以表示為ui,1∩...∩ui,nk.

每個ui都有一組單獨的特征組合.

因此就有K?CNF的公式:

如果假設(shè)ui,ni 又是一組新的bool表達式而不是數(shù)值山析,那么有點樹模型的感覺:

有k顆數(shù),取每棵樹的最大值. 而每顆數(shù)都有n個分支倔幼,所有滿足n個分支的盖腿,就滿足concept集合.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子翩腐,更是在濱河造成了極大的恐慌鸟款,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件茂卦,死亡現(xiàn)場離奇詭異何什,居然都是意外死亡,警方通過查閱死者的電腦和手機等龙,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進店門处渣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人蛛砰,你說我怎么就攤上這事罐栈。” “怎么了泥畅?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵荠诬,是天一觀的道長。 經(jīng)常有香客問我位仁,道長柑贞,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任聂抢,我火速辦了婚禮钧嘶,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘琳疏。我一直安慰自己有决,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布轿亮。 她就那樣靜靜地躺著疮薇,像睡著了一般轰豆。 火紅的嫁衣襯著肌膚如雪龟再。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天梭纹,我揣著相機與錄音但骨,去河邊找鬼励七。 笑死,一個胖子當(dāng)著我的面吹牛奔缠,可吹牛的內(nèi)容都是我干的掠抬。 我是一名探鬼主播,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼校哎,長吁一口氣:“原來是場噩夢啊……” “哼两波!你這毒婦竟也來了瞳步?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤腰奋,失蹤者是張志新(化名)和其女友劉穎单起,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體劣坊,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡嘀倒,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了局冰。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片测蘑。...
    茶點故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖康二,靈堂內(nèi)的尸體忽然破棺而出碳胳,到底是詐尸還是另有隱情,我是刑警寧澤沫勿,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布固逗,位于F島的核電站,受9級特大地震影響藕帜,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜惜傲,卻給世界環(huán)境...
    茶點故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一洽故、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧盗誊,春花似錦时甚、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至开镣,卻和暖如春刀诬,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背邪财。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工陕壹, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人树埠。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓糠馆,卻偏偏與公主長得像,于是被迫代替她去往敵國和親怎憋。 傳聞我的和親對象是個殘疾皇子又碌,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,077評論 2 355

推薦閱讀更多精彩內(nèi)容