第三章 PAC leaning 'Why machine can learning'

在第二章里我們學(xué)到了有限假設(shè)集

回顧:

經(jīng)驗(yàn)風(fēng)險(xiǎn):Ls代表了在假設(shè)為h的情況下?lián)p失的表達(dá)式


可以選擇使得經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的假設(shè),作為選擇的假設(shè)

當(dāng)H是有限集的時(shí)候审轮,模型不會(huì)有過擬合的風(fēng)險(xiǎn),并且如果ERM是在這個(gè)有限集中被提供了大量數(shù)據(jù)的話辽俗,可以認(rèn)為最后得到的假設(shè)是一個(gè)概率近似準(zhǔn)確的假設(shè)(PAC(Probably Approximately Correct))


PAC learninability 的定義:

\exists m_h : (0,1)^2 \rightarrow N以及一個(gè)具有如下條件的學(xué)習(xí)算法:\forall \epsilon,\delta \in  (0,1)\,  and\;  for\,every\,\mathcal{D\,} over\mathcal{X\,},and \,for \, every\,label\,function\;f:\mathcal{X}\rightarrow \,\{0,1\}

如果訓(xùn)練過程滿足以上\mathcal{H,D,f}疾渣,即樣本采樣自分布\mathcal{D},真正的映射關(guān)系是\mathcal{f},那么最后預(yù)估出來的假設(shè)h以至少1-\delta的概率使得L_{(D,f)}(h)<\epsilon

這個(gè)定義中崖飘,\epsilon衡量了最后學(xué)習(xí)出來的h有多接近f榴捡,即h的準(zhǔn)確度。\delta衡量了h接近\epsilon的置信度朱浴。實(shí)際上吊圾,因?yàn)楸M管訓(xùn)練集可以采樣再多來自真實(shí)分布的樣本,但畢竟不能用這些大量的數(shù)據(jù)去完全代表真實(shí)的分布翰蠢,那么采用這個(gè)訓(xùn)練集去訓(xùn)練或多或少會(huì)有一些偏差项乒,所以上面的兩個(gè)參數(shù),在實(shí)際訓(xùn)練中都是不可避免的會(huì)遇見的梁沧。而\epsilon可以讓看作學(xué)習(xí)過程中的少量偏差的接受程度檀何。

m_h : (0,1)^2 \rightarrow N決定了學(xué)習(xí)過程中的采樣復(fù)雜度,換句話說廷支,這個(gè)方程可以看作是频鉴,為了保證PAC的話,至少需要采樣多少樣本恋拍。實(shí)際訓(xùn)練中垛孔,其實(shí)上m的方程有很多都是滿足條件的,一般選擇最小的m滿足\epsilon芝囤,\delta的PAC學(xué)習(xí)似炎。

一般情況下這個(gè)m可以被一個(gè)關(guān)于,\epsilon悯姊,\delta的方程bound住

對(duì)于任意有限假設(shè)集羡藐,都存在這樣的一個(gè)m滿足要求


General Learning Model:

剛才描述的模型其實(shí)很容易推廣,可以通過以下兩個(gè)角度讓模型更加一般化

1悯许,刪除可實(shí)現(xiàn)性假設(shè):上面的PAC模型所需要的條件其實(shí)是非常強(qiáng)的仆嗦,不僅需要在真實(shí)分布中采樣,而且標(biāo)注的內(nèi)容也需要十分準(zhǔn)確先壕。下面會(huì)介紹Agnostic PAC模型

2瘩扼,之前介紹的基本都是二分類模型谆甜,模型其實(shí)可以被推廣到各類學(xué)習(xí)任務(wù)當(dāng)中

Agnostic PAC:

在第一章里面做了這樣的一個(gè)假設(shè),

\exists h^{\star} \in \mathcal{h} \; such\,that\, \mathbb{P}_{x\sim\mathcal{D}}[h^\star(x) = f(x)] = 1這個(gè)假設(shè)在很多現(xiàn)實(shí)問題里面是不成立的集绰,那么更現(xiàn)實(shí)的假設(shè)是什么呢规辱?

現(xiàn)在設(shè)定\mathcal{D}為x,y的聯(lián)合分布(之前可以看作是訓(xùn)練數(shù)據(jù)的真實(shí)分布)\mathcal{D}_x\mathcal{D}的邊緣分布,代表沒標(biāo)注的x的分布栽燕,D((x,y)|x)代表label y 的條件分布罕袋。這樣去設(shè)計(jì)模型實(shí)際上允許不同的數(shù)據(jù)具有相同的特征時(shí),屬于不同的預(yù)測(cè)結(jié)果碍岔。

這樣假設(shè)的情況下浴讯,誤差將會(huì)被寫成如下的形式:

跟之前PAC不同的點(diǎn)就是,在這里括號(hào)里不是h(x) 不等于 f(x)

同理蔼啦,經(jīng)驗(yàn)風(fēng)險(xiǎn)如下:

同上
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末榆纽,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子捏肢,更是在濱河造成了極大的恐慌奈籽,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,539評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件猛计,死亡現(xiàn)場(chǎng)離奇詭異唠摹,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)奉瘤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評(píng)論 3 396
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來煮甥,“玉大人盗温,你說我怎么就攤上這事〕芍猓” “怎么了卖局?”我有些...
    開封第一講書人閱讀 165,871評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)双霍。 經(jīng)常有香客問我砚偶,道長(zhǎng),這世上最難降的妖魔是什么洒闸? 我笑而不...
    開封第一講書人閱讀 58,963評(píng)論 1 295
  • 正文 為了忘掉前任染坯,我火速辦了婚禮,結(jié)果婚禮上丘逸,老公的妹妹穿的比我還像新娘单鹿。我一直安慰自己,他們只是感情好深纲,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,984評(píng)論 6 393
  • 文/花漫 我一把揭開白布仲锄。 她就那樣靜靜地躺著劲妙,像睡著了一般。 火紅的嫁衣襯著肌膚如雪儒喊。 梳的紋絲不亂的頭發(fā)上镣奋,一...
    開封第一講書人閱讀 51,763評(píng)論 1 307
  • 那天,我揣著相機(jī)與錄音怀愧,去河邊找鬼侨颈。 笑死,一個(gè)胖子當(dāng)著我的面吹牛掸驱,可吹牛的內(nèi)容都是我干的肛搬。 我是一名探鬼主播,決...
    沈念sama閱讀 40,468評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼毕贼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼温赔!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起鬼癣,我...
    開封第一講書人閱讀 39,357評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤陶贼,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后待秃,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體拜秧,經(jīng)...
    沈念sama閱讀 45,850評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,002評(píng)論 3 338
  • 正文 我和宋清朗相戀三年章郁,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了枉氮。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,144評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡暖庄,死狀恐怖聊替,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情培廓,我是刑警寧澤惹悄,帶...
    沈念sama閱讀 35,823評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站肩钠,受9級(jí)特大地震影響泣港,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜价匠,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,483評(píng)論 3 331
  • 文/蒙蒙 一当纱、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧霞怀,春花似錦惫东、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,026評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)颓遏。三九已至,卻和暖如春滞时,著一層夾襖步出監(jiān)牢的瞬間叁幢,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,150評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工坪稽, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留曼玩,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,415評(píng)論 3 373
  • 正文 我出身青樓窒百,卻偏偏與公主長(zhǎng)得像黍判,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子篙梢,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,092評(píng)論 2 355