【機(jī)器學(xué)習(xí)中的數(shù)學(xué)】比例混合分布

比例混合分布(Scale Mixture Distribution)

混合分布是來自其他隨機(jī)變量的集合構(gòu)成的隨機(jī)變量的概率分布:一個(gè)隨機(jī)變量是根據(jù)給定的概率從集合隨機(jī)選取的逗爹,然后所選隨機(jī)變量的值就得到了( first, a random variable is selected by chance from the collection according to given probabilities of selection, and then the value of the selected random variable is realized)烛占。
當(dāng)潛在的隨機(jī)變量是連續(xù)的情況下,混合得到的隨機(jī)變量也是連續(xù)的作谚,并且其概率密度函數(shù)有時(shí)被稱作是一個(gè)混合密度,其累積分布函數(shù)(cumulative distribution function)可以表示成其他分布函數(shù)的凸組合(convex combination庵芭,i.e. a weighted sum, with non-negative weights that sum to 1)妹懒。

有限可數(shù)混合體

給定一個(gè)有限的概率密度函數(shù)集合p1(x),...,pn(x),或者相對應(yīng)的累積分布函數(shù)P1(x),...,Pn(x)和權(quán)值w1,...,wn(wi>=0,sum(wi)=1)双吆,該混合分布可以被表示為密度函數(shù)f眨唬,或者分布函數(shù)F:




這種類型的混合體稱作有限混合(finite mixture)。

不可數(shù)混合體

當(dāng)組成的分布式不可數(shù)的伊诵,這個(gè)分布就被稱為混合概率分布(compound probability distribution)单绑。這種分布的構(gòu)造是用積分來代替有限情況下的求和形式。
考慮一個(gè)隨機(jī)變量為x曹宴,參數(shù)為a的概率密度函數(shù)p(x;a)搂橙。對于在集合A中的每一個(gè)值a,p(x;a)是一個(gè)關(guān)于x的概率密度函數(shù)笛坦,給出概率密度函數(shù)w(要求w非負(fù)且積分為1),則函數(shù):



f(x)就是一個(gè)關(guān)于x的概率密度函數(shù)区转。

Gamma函數(shù)

了解Gamma函數(shù)的性質(zhì)和一些有用的計(jì)算公式,在后面復(fù)雜的分布中會用到這些公式和表示方式版扩。



學(xué)生t-分布及其混合分布

學(xué)生t-分布(Student's t-distribution)

在概率論和統(tǒng)計(jì)學(xué)中废离,學(xué)生t-分布(Student's t-distribution),可簡稱為t分布礁芦。應(yīng)用在估計(jì)呈正態(tài)分布的母群體之平均數(shù)蜻韭。它是對兩個(gè)樣本均值差異進(jìn)行顯著性測試的學(xué)生t檢定的基礎(chǔ)。



其中柿扣,ν被稱作自由度(degrees of freedom)肖方,當(dāng)ν=1時(shí),該分布退化為柯西分布(Cauchy Distribution)未状;當(dāng)ν→∞時(shí)俯画,該分布為高斯分布。

Scale Mixture of Normals

Student T分布可以看做是正態(tài)分布和Gamma分布的混合體司草,由于是連續(xù)分布艰垂,所以該混合體表示為積分形式。其公式推導(dǎo)如下埋虹,在求解積分時(shí)用到了之前Gamma函數(shù)中列舉的有用的積分公式:


Laplace分布及其混合分布

laplace分布

在概率論與統(tǒng)計(jì)學(xué)中猜憎,拉普拉斯分布是以皮埃爾-西蒙·拉普拉斯的名字命名的一種連續(xù)概率分布。由于它可以看作是兩個(gè)不同位置的指數(shù)分布背靠背拼接在一起搔课,所以它也叫作雙指數(shù)分布拉宗。兩個(gè)相互獨(dú)立同概率分布指數(shù)隨機(jī)變量之間的差別是按照指數(shù)分布的隨機(jī)時(shí)間布朗運(yùn)動,所以它遵循拉普拉斯分布辣辫。
如果隨機(jī)變量的概率密度函數(shù)分布為:



那么它就是拉普拉斯分布旦事。其中,μ是位置參數(shù)急灭,b>0是尺度參數(shù)姐浮。

Gaussian-Exponential Mixture

laplace分布可以看成是高斯分布和指數(shù)分布的混合體。


負(fù)二項(xiàng)分布及其混合分布

負(fù)二項(xiàng)分布(Negative Biomial Distribution)

負(fù)二項(xiàng)分布是統(tǒng)計(jì)學(xué)上一種離散概率分布葬馋÷衾穑“負(fù)二項(xiàng)分布”與“二項(xiàng)分布”的區(qū)別在于:“二項(xiàng)分布”是固定試驗(yàn)總次數(shù)N的獨(dú)立試驗(yàn)中,成功次數(shù)k的分布畴嘶;而“負(fù)二項(xiàng)分布”是所有到成功r次時(shí)即終止的獨(dú)立試驗(yàn)中蛋逾,失敗次數(shù)k的分布。
其概率質(zhì)量函數(shù)為:


Gamma-Poisson Mixture

Negative Biomial分布可以看做是Gamma分布和泊松分布的混合體窗悯。


混合分布的意義

這里我們列舉了三種常見分布及其混合分布区匣,這種混合分布的表示形式的意義在于,復(fù)雜分布的期望和方差等數(shù)字特征不好求解蒋院,但可以將其表示為更加簡單的分布的混合形式亏钩,我們知道高斯分布、泊松分布等分布的數(shù)字特征可以由其參數(shù)得到欺旧,這樣的話姑丑,就可以很容易的通過簡單的分布得到復(fù)雜分布的一些數(shù)字特征。

參考資料

Wiki:Mixture Distribution
LDA-math-神奇的Gamma函數(shù)
神奇的伽瑪函數(shù)(上)
神奇的伽瑪函數(shù)(下)

轉(zhuǎn)載請注明作者Jason Ding及其出處
Github博客主頁(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
簡書主頁(http://www.reibang.com/users/2bd9b48f6ea8/latest_articles)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末辞友,一起剝皮案震驚了整個(gè)濱河市栅哀,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌称龙,老刑警劉巖留拾,帶你破解...
    沈念sama閱讀 217,509評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異茵瀑,居然都是意外死亡间驮,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評論 3 394
  • 文/潘曉璐 我一進(jìn)店門马昨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來竞帽,“玉大人,你說我怎么就攤上這事鸿捧∫俾ǎ” “怎么了?”我有些...
    開封第一講書人閱讀 163,875評論 0 354
  • 文/不壞的土叔 我叫張陵匙奴,是天一觀的道長堆巧。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么谍肤? 我笑而不...
    開封第一講書人閱讀 58,441評論 1 293
  • 正文 為了忘掉前任啦租,我火速辦了婚禮,結(jié)果婚禮上荒揣,老公的妹妹穿的比我還像新娘篷角。我一直安慰自己,他們只是感情好系任,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,488評論 6 392
  • 文/花漫 我一把揭開白布恳蹲。 她就那樣靜靜地躺著,像睡著了一般俩滥。 火紅的嫁衣襯著肌膚如雪嘉蕾。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,365評論 1 302
  • 那天霜旧,我揣著相機(jī)與錄音错忱,去河邊找鬼。 笑死颁糟,一個(gè)胖子當(dāng)著我的面吹牛航背,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播棱貌,決...
    沈念sama閱讀 40,190評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼玖媚,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了婚脱?” 一聲冷哼從身側(cè)響起今魔,我...
    開封第一講書人閱讀 39,062評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎障贸,沒想到半個(gè)月后错森,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,500評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡篮洁,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,706評論 3 335
  • 正文 我和宋清朗相戀三年涩维,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片袁波。...
    茶點(diǎn)故事閱讀 39,834評論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡瓦阐,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出篷牌,到底是詐尸還是另有隱情睡蟋,我是刑警寧澤,帶...
    沈念sama閱讀 35,559評論 5 345
  • 正文 年R本政府宣布枷颊,位于F島的核電站戳杀,受9級特大地震影響该面,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜信卡,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,167評論 3 328
  • 文/蒙蒙 一隔缀、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧坐求,春花似錦蚕泽、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,779評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽仔蝌。三九已至泛领,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間敛惊,已是汗流浹背渊鞋。 一陣腳步聲響...
    開封第一講書人閱讀 32,912評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留瞧挤,地道東北人锡宋。 一個(gè)月前我還...
    沈念sama閱讀 47,958評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像特恬,于是被迫代替她去往敵國和親执俩。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,779評論 2 354

推薦閱讀更多精彩內(nèi)容