Day4 第一章 統(tǒng)計(jì)學(xué)習(xí)及監(jiān)督學(xué)習(xí)概論(習(xí)題與總結(jié))

1?幾點(diǎn)收獲與思考

  • 在監(jiān)督學(xué)習(xí)中,訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)被看作是依聯(lián)合概率密度分布 P(X,Y) 獨(dú)立同分布產(chǎn)生的沸呐。
  • 監(jiān)督學(xué)習(xí)中断部,概率模型是生成模型优训,非概率模型是判別模型朵你。而條件概率分布和與函數(shù)可以相互轉(zhuǎn)化。所以揣非,概率模型和非概率模型的區(qū)別在于模型的內(nèi)在結(jié)構(gòu)抡医。這里 “模型的內(nèi)在結(jié)構(gòu)” 應(yīng)該指的是能否還原出聯(lián)合概率分布
  • 核方法是用通過(guò)定義核函數(shù)直接計(jì)算映射之后再特征空間的內(nèi)積早敬。
  • 極大似然估計(jì)等價(jià)于當(dāng)模型是條件概率分布忌傻、損失函數(shù)是對(duì)數(shù)損失函數(shù)時(shí)的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化策略。貝葉斯估計(jì)中的最大后驗(yàn)概率估計(jì)是當(dāng)模型是條件概率分布搞监、損失函數(shù)是對(duì)數(shù)函數(shù)水孩、模型復(fù)雜度由模型的先驗(yàn)概率表示時(shí)的結(jié)構(gòu)風(fēng)險(xiǎn)最小化策略。
  • 結(jié)構(gòu)風(fēng)險(xiǎn)最小化是在經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的基礎(chǔ)上增加表示模型復(fù)雜度的正則化項(xiàng)以防止過(guò)擬合琐驴。
  • 學(xué)習(xí)方法的泛化能力分析是通過(guò)理論研究泛化誤差的概率上界進(jìn)行的俘种,往往比較復(fù)雜。在現(xiàn)實(shí)中一般使用測(cè)試誤差來(lái)評(píng)價(jià)绝淡,但是結(jié)果有可能不可靠宙刘。
  • 生成方法的學(xué)習(xí)收斂速度更快,而判別方法的學(xué)習(xí)準(zhǔn)確率更高够委。
    (why荐类?希望能在后續(xù)的學(xué)習(xí)中逐漸理解)

2?習(xí)題

習(xí)題1.1?說(shuō)明伯努利模型的極大似然估計(jì)以及貝葉斯估計(jì)中的統(tǒng)計(jì)學(xué)習(xí)方法三要素。伯努利模型是定義在取值為 0 與 1 的隨機(jī)變量上的概率分布茁帽。假設(shè)觀測(cè)到伯努利模型 n 次獨(dú)立的數(shù)據(jù)生成結(jié)果玉罐,其中 k 次的結(jié)果為 1,這時(shí)可以使用極大似然估計(jì)或貝葉斯估計(jì)來(lái)估計(jì)結(jié)果為 1 的概率潘拨。

解:
(1)伯努利模型
??伯努利模型是定義在取值為 0 與 1 的隨機(jī)變量上的概率分布吊输。對(duì)于隨機(jī)變量 X 有,參數(shù)為 p(0<p<1)铁追,它分別以概率 p1-p 取 1 和 0 為值季蚂。隨機(jī)變量 X 的概率分布函數(shù)即模型可以寫為P(X=x|p)=\left\{\begin{align} & p^x(1-p)^{1-x},\ x=0,1;\\ & 0 \qquad\qquad\quad,\ \text{else}. \\ \end{align} \right.??伯努利模型的假設(shè)空間為\mathcal{F}=\{P|P(X=x|p), p\in [0,1]\}(2)伯努利模型的極大似然估計(jì)中的統(tǒng)計(jì)學(xué)習(xí)方法三要素
??模型:伯努利模型
??策略:經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化。當(dāng)模型是條件概率分布琅束、損失函數(shù)是對(duì)數(shù)損失函數(shù)時(shí)的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化就等價(jià)于極大似然估計(jì)扭屁。
??算法:極大似然估計(jì):\hat{p}=\arg\max\limits_p L(p|X)??其中 L(p|X) 為樣本的似然函數(shù)
(3)伯努利模型的貝葉斯估計(jì)中的統(tǒng)計(jì)學(xué)習(xí)方法三要素
??模型:伯努利模型
??策略:結(jié)構(gòu)風(fēng)險(xiǎn)最小化涩禀。當(dāng)模型是條件概率分布料滥、損失函數(shù)是對(duì)數(shù)損失函數(shù)、模型復(fù)雜度由模型的先驗(yàn)概率表示時(shí)的結(jié)構(gòu)風(fēng)險(xiǎn)最小化等價(jià)于貝葉斯估計(jì)中的最大后驗(yàn)概率估計(jì)艾船。
??算法:最大后驗(yàn)概率估計(jì):\hat{p}=\arg\max\limits_p \hat P(p|X)??其中 \hat P(p|X)后驗(yàn)概率分布葵腹。

習(xí)題1.2?通過(guò)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化推導(dǎo)極大似然估計(jì)高每。證明模型是條件概率分布,當(dāng)損失函數(shù)是對(duì)數(shù)損失函數(shù)時(shí)践宴,經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化等價(jià)于極大似然估計(jì)鲸匿。

(參考了給出的解答思路)

解答思路

  • 根據(jù)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化定義,寫出目標(biāo)函數(shù)阻肩;
  • 根據(jù)對(duì)數(shù)損失函數(shù)带欢,對(duì)目標(biāo)函數(shù)進(jìn)行整理;
  • 根據(jù)似然函數(shù)定義和極大似然估計(jì)的一般步驟磺浙,得到結(jié)論洪囤。

解:
??已知模型是條件概率分布,損失函數(shù)為對(duì)數(shù)損失函數(shù)撕氧。設(shè)條件概率分布為 P_\theta(Y|X)(離散為概率分布列 p(x;\theta)瘤缩,連續(xù)為概率密度函數(shù)f(x;\theta)),樣本集 D=\{(x_1,y_1),(x_2,y_2),\dots,(x_N,y_N)\}伦泥,N 為樣本數(shù)剥啤,對(duì)數(shù)損失函數(shù)為:L(Y,P(Y|X))=-\log P(Y|X)??經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化求解最優(yōu)模型就是求解最優(yōu)化問(wèn)題:\min_\limits{f\in\mathcal{F}} \frac{1}{N}\sum\limits_{i=1}^{N} L(y_i,P(y_i|x_i))其中,\mathcal{F} 是假設(shè)空間不脯。
??結(jié)合上述兩個(gè)式子府怯,可以得到\begin{align} \min_\limits{f\in\mathcal{F}} \frac{1}{N}\sum\limits_{i=1}^{N} L(y_i,P(y_i|x_i)) = & \min_\limits{f\in\mathcal{F}} \frac{1}{N}\sum\limits_{i=1}^{N} \big(-\log P(y_i|x_i)\big) \\ = & \ \frac{1}{N} \max_\limits{f\in\mathcal{F}} \big(\log \prod\limits_{i=1}^{N} P(y_i|x_i)\big)\\ \end{align}??根據(jù)似然函數(shù)的定義有 L(\theta)=L(x_1,x_2,\dots ,x_N;\theta)=\prod\limits_{i=1}^{N} P_{\theta} (y_i|x_i),再結(jié)合最大似然估計(jì)的一般過(guò)程防楷,不難發(fā)現(xiàn)\arg\min_\limits{f\in\mathcal{F}} \frac{1}{N}\sum\limits_{i=1}^{N} L(y_i,P(y_i|x_i)) = \frac{1}{N} \arg \max_\limits{f\in\mathcal{F}} \big(\log L(\theta)\big)即經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化等價(jià)于極大似然估計(jì)牺丙,Q.E.D

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市复局,隨后出現(xiàn)的幾起案子冲簿,更是在濱河造成了極大的恐慌,老刑警劉巖亿昏,帶你破解...
    沈念sama閱讀 216,470評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件峦剔,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡角钩,警方通過(guò)查閱死者的電腦和手機(jī)吝沫,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,393評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)递礼,“玉大人惨险,你說(shuō)我怎么就攤上這事〖顾瑁” “怎么了平道?”我有些...
    開(kāi)封第一講書人閱讀 162,577評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)供炼。 經(jīng)常有香客問(wèn)我一屋,道長(zhǎng),這世上最難降的妖魔是什么袋哼? 我笑而不...
    開(kāi)封第一講書人閱讀 58,176評(píng)論 1 292
  • 正文 為了忘掉前任冀墨,我火速辦了婚禮,結(jié)果婚禮上涛贯,老公的妹妹穿的比我還像新娘诽嘉。我一直安慰自己,他們只是感情好弟翘,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,189評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布虫腋。 她就那樣靜靜地躺著,像睡著了一般稀余。 火紅的嫁衣襯著肌膚如雪悦冀。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 51,155評(píng)論 1 299
  • 那天睛琳,我揣著相機(jī)與錄音盒蟆,去河邊找鬼。 笑死师骗,一個(gè)胖子當(dāng)著我的面吹牛历等,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播辟癌,決...
    沈念sama閱讀 40,041評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼寒屯,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了黍少?” 一聲冷哼從身側(cè)響起寡夹,我...
    開(kāi)封第一講書人閱讀 38,903評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎仍侥,沒(méi)想到半個(gè)月后要出,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,319評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡农渊,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,539評(píng)論 2 332
  • 正文 我和宋清朗相戀三年患蹂,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片砸紊。...
    茶點(diǎn)故事閱讀 39,703評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡传于,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出醉顽,到底是詐尸還是另有隱情沼溜,我是刑警寧澤,帶...
    沈念sama閱讀 35,417評(píng)論 5 343
  • 正文 年R本政府宣布游添,位于F島的核電站系草,受9級(jí)特大地震影響通熄,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜找都,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,013評(píng)論 3 325
  • 文/蒙蒙 一唇辨、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧能耻,春花似錦赏枚、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,664評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至戒职,卻和暖如春栗恩,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背帕涌。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,818評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工摄凡, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人蚓曼。 一個(gè)月前我還...
    沈念sama閱讀 47,711評(píng)論 2 368
  • 正文 我出身青樓亲澡,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親纫版。 傳聞我的和親對(duì)象是個(gè)殘疾皇子床绪,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,601評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容