廣義線性模型烘挫、指數(shù)分布族中的高斯分布阿蝶、伯努利分布

姓名：崔少杰 ? ? ? 學(xué)號(hào)：16040510021

轉(zhuǎn)載自：http://www.reibang.com/p/d1b7ca81d1af=有修改

【嵌牛導(dǎo)讀】：廣義線性模型雳锋、指數(shù)分布族中的高斯分布、伯努利分布

【嵌牛鼻子】：廣義線性模型羡洁、指數(shù)分布族玷过、高斯分布、伯努利分布

【嵌牛提問】：為什么要有指數(shù)分布族筑煮？

【嵌牛正文】：定義指數(shù)分布族：（指數(shù)分布族的定義符號(hào)有很多版本辛蚊，這里采用的是CS229 描述的寫法，注意PRML的寫法稍有不同真仲，CS229是斯坦福大學(xué)Andrew NG的機(jī)器學(xué)習(xí)課程袋马，PRML是模式識(shí)別機(jī)器學(xué)習(xí)的經(jīng)典書籍）

指數(shù)分布族形式

η 是自然參數(shù)（natural parameter，also called thecanonical parameter）袒餐。

T(y) ?是充分統(tǒng)計(jì)量（sufficient statistic），一般情況下就是y谤狡。

a(η) 是對(duì)數(shù)部分函數(shù)（log partition function）灸眼，這部分確保Y的分布p(y:η) 計(jì)算的結(jié)果加起來（連續(xù)函數(shù)是積分）等于1.

伯努利分布作為指數(shù)分布族的例子（比如在某段時(shí)間內(nèi)，廣告被點(diǎn)擊的分布墓懂；某段時(shí)間內(nèi)焰宣，顧客是否進(jìn)店等等）：

設(shè) 均值（mean)為 φ,分布在Y上的取值為{0,1}，因此

p(y= 1;φ) =φ;

p(y= 0;φ) = 1?φ

即捕仔，調(diào)整φ,得到不同的伯努利分布匕积，一旦設(shè)定好φ，T,a,b都被固定住榜跌，就能得到一個(gè)伯努利分布闪唆。

如

伯努利分布

把上式的右邊改寫成指數(shù)分布族形式

指數(shù)分布族形式

可以看出，

b(y) = 1

T(y) = y

a(η) = -log(1?φ)

η = log (φ/(1-φ))

因此 φ=

這個(gè)就是sigmoid函數(shù)了钓葫，也是logistic 函數(shù)悄蕾，Great.

高斯分布作為指數(shù)分布族的例子（線性回歸 linear regression）：

假設(shè) σ^2 = 1

(注：If we leaveσ2as a variable, the Gaussian distribution can also be shown to be in the)

exponential family, whereη∈R2is now a 2-dimension vector that depends on bothμandσ. For the purposes of GLMs, however, theσ2parameter can also be treated by considering

a more general definition of the exponential family:p(y;η, τ) =b(a, τ) exp((ηTT(y)?a(η))/c(τ)). Here,τis called thedispersion parameter, and for the Gaussian,c(τ) =σ2;

but given our simplification above, we won’t need the more general definition for the

examples we will consider here.） ?From CS229 lecture notes。

高斯分布

指數(shù)分布族的形式為

指數(shù)分布族形式

可以看出础浮，

當(dāng)然指數(shù)分布族中的成員很多帆调，泊松分布，gamma分布豆同，beta分布等等番刊，碰到需要解決一個(gè)具體問題的時(shí)候（比如要去判斷多少人在一個(gè)時(shí)間段內(nèi)訪問某個(gè)店，也是某一家店需要擴(kuò)張選店的其中一個(gè)依據(jù)）影锈，泊松分布是一個(gè)很好的模型芹务，泊松分布恰巧也是屬于指數(shù)分布族蝉绷。

下面描述一個(gè)方法：如何構(gòu)造一個(gè)廣義線性模型(GLMS)來解決上述問題（如某個(gè)時(shí)間段內(nèi)，多少人進(jìn)店）

具體來說锄禽，思考一個(gè)分類（classification）問題或者回歸(regression)問題潜必，我們需要預(yù)測(cè)隨機(jī)變量Y是X的函數(shù)（比如多少人進(jìn)店的問題，X是某個(gè)店的獎(jiǎng)勵(lì)政策沃但、近期廣告等等一些特征）

要建立一個(gè)GLM處理這個(gè)問題磁滚，首先做三個(gè)假設(shè)：

1：給定X、θ宵晚，Y的分布服從某個(gè)指數(shù)族分布（nature parameter = η）.

2:給定X垂攘，目標(biāo)是預(yù)測(cè)E[Y|x]（大部分情況下，T(Y) = Y,）,即淤刃，假設(shè)函數(shù)（hypothesis）h(x) = E[Y|x].

比如線性回歸的hypothesis:

比如logistic regression的hypothesis：

hθ(x) =p(y= 1|x;θ) = 0·p(y=0|x;θ)+1·p(y= 1|x;θ) = E[y|x;θ]

3：η和X線性（叫“指定選擇” design choice 可能更合適）：

應(yīng)用三個(gè)假設(shè)舉例如下：

比如最小二乘（ordinary least square regression）晒他，是指數(shù)分布族模型的一種special case。

ordinary least square regression ,Andrew 在9.1寫的是Ordinary least square 逸贾，我自己理解為這里講的是ordinary least square regression,)

Andrew 使用的術(shù)語是canonical link function：g(μ) =η陨仅，用來描述均值（mean）依賴線性預(yù)測(cè)器（linear predictor ）,E(Y) =μ,g(μ) =η.

canonical response function 是canonical link function的反函數(shù)。

根據(jù)假設(shè)2铝侵，可以得出

假設(shè)2

根據(jù)假設(shè)1灼伤，假設(shè)服從高斯分布，可以得出

假設(shè)1

高斯分布 η = μ(參考前述高斯分布) 咪鲜，

根據(jù)假設(shè)3：

假設(shè)3

比如 logistic regression 同理：

等式2為伯努利分布的均值

假設(shè)2可得到等式1

假設(shè)1可得到等式3

假設(shè)3可得到等式4

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末狐赡，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子疟丙，更是在濱河造成了極大的恐慌颖侄，老刑警劉巖，帶你破解...
沈念sama閱讀 218,941評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件享郊，死亡現(xiàn)場(chǎng)離奇詭異览祖，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)炊琉，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,397評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門穴墅，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人温自，你說我怎么就攤上這事玄货。” “怎么了悼泌？”我有些...
開封第一講書人閱讀 165,345評(píng)論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵松捉，是天一觀的道長(zhǎng)。經(jīng)常有香客問我馆里，道長(zhǎng)隘世，這世上最難降的妖魔是什么可柿？我笑而不...
開封第一講書人閱讀 58,851評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮丙者，結(jié)果婚禮上复斥，老公的妹妹穿的比我還像新娘。我一直安慰自己械媒，他們只是感情好目锭，可當(dāng)我...
茶點(diǎn)故事閱讀 67,868評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著纷捞，像睡著了一般痢虹。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上主儡，一...
開封第一講書人閱讀 51,688評(píng)論 1贊 305
城市分裂傳說
那天奖唯，我揣著相機(jī)與錄音，去河邊找鬼糜值。笑死丰捷，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的寂汇。我是一名探鬼主播病往，決...
沈念sama閱讀 40,414評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼健无！你這毒婦竟也來了荣恐？” 一聲冷哼從身側(cè)響起液斜，我...
開封第一講書人閱讀 39,319評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤累贤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后少漆，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體臼膏，經(jīng)...
沈念sama閱讀 45,775評(píng)論 1贊 315
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,945評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年示损，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了渗磅。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,096評(píng)論 1贊 350
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡检访，死狀恐怖始鱼，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情脆贵，我是刑警寧澤医清，帶...
沈念sama閱讀 35,789評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站卖氨，受9級(jí)特大地震影響会烙，放射性物質(zhì)發(fā)生泄漏负懦。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,437評(píng)論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一柏腻、第九天我趴在偏房一處隱蔽的房頂上張望纸厉。院中可真熱鬧，春花似錦五嫂、人聲如沸颗品。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,993評(píng)論 0贊 22
一樁弒父案贫导，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽抛猫。三九已至，卻和暖如春孩灯，著一層夾襖步出監(jiān)牢的瞬間闺金，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,107評(píng)論 1贊 271
情欲美人皮
我被黑心中介騙來泰國(guó)打工峰档，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留败匹，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,308評(píng)論 3贊 372
代替公主和親
正文我出身青樓讥巡，卻偏偏與公主長(zhǎng)得像掀亩，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子欢顷，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,037評(píng)論 2贊 355

廣義線性模型奕锌、指數(shù)分布族中的高斯分布梢夯、伯努利分布

廣義線性模型烘挫、指數(shù)分布族中的高斯分布阿蝶、伯努利分布

推薦閱讀更多精彩內(nèi)容