常見概率分布介紹

常見概率分布

Bernoulli分布

Bernoulli分布是單個二值隨機(jī)變量分布, 單參數(shù)\phi?∈[0,1]控制,\phi?給出隨機(jī)變量等于1的概率. 基本形式為:

image.png

其期望為:
E(x)=\sum x P(x)=0 \times q+1 \times p=p
其方差為:
\operatorname{Var}(x)=E\left[(x-E(x))^{2}\right]=\sum(x-p)^{2} P(x)=p q

Multinoulli分布也叫范疇分布, 是單個k值隨機(jī)分布,經(jīng)常用來表示對象分類的分布. 其中k是有限值.Multinoulli分布由向量\vec{p}\in[0,1]^{k-1}參數(shù)化,每個分量p_i表示第i個狀態(tài)的概率, 且p_k=1-1^Tp?.

適用范圍: 伯努利分布適合對離散型隨機(jī)變量建模.

高斯分布

高斯也叫正態(tài)分布(Normal Distribution), 概率度函數(shù)如下:
N(x;\mu,\sigma^2) = \sqrt{\frac{1}{2\pi\sigma^2}}exp\left ( -\frac{1}{2\sigma^2}(x-\mu)^2 \right )
其中, \mu?\sigma?分別是均值和方差, 中心峰值x坐標(biāo)由\mu?給出, 峰的寬度受\sigma?控制, 最大點在x=\mu?處取得, 拐點為x=\mu\pm\sigma?

正態(tài)分布中设凹,±1\sigma闪朱、±2\sigma、±3\sigma下的概率分別是68.3%锄开、95.5%称诗、99.73%,這3個數(shù)最好記住。

此外, 令\mu=0,\sigma=1?高斯分布即簡化為標(biāo)準(zhǔn)正態(tài)分布:
N(x;\mu,\sigma^2) = \sqrt{\frac{1}{2\pi}}exp\left ( -\frac{1}{2}x^2 \right )
對概率密度函數(shù)高效求值:
N(x;\mu,\beta^{-1})=\sqrt{\frac{\beta}{2\pi}}exp\left(-\frac{1}{2}\beta(x-\mu)^2\right)

其中再榄,\beta=\frac{1}{\sigma^2}通過參數(shù)\beta∈(0享潜,\infty)?來控制分布精度。

何時采用正態(tài)分布

問: 何時采用正態(tài)分布?
答: 缺乏實數(shù)上分布的先驗知識, 不知選擇何種形式時, 默認(rèn)選擇正態(tài)分布總是不會錯的, 理由如下:

  1. 中心極限定理告訴我們, 很多獨立隨機(jī)變量均近似服從正態(tài)分布, 現(xiàn)實中很多復(fù)雜系統(tǒng)都可以被建模成正態(tài)分布的噪聲, 即使該系統(tǒng)可以被結(jié)構(gòu)化分解.
  2. 正態(tài)分布是具有相同方差的所有概率分布中, 不確定性最大的分布, 換句話說, 正態(tài)分布是對模型加入先驗知識最少的分布.

正態(tài)分布的推廣:
正態(tài)分布可以推廣到R^n空間, 此時稱為多位正態(tài)分布, 其參數(shù)是一個正定對稱矩陣\Sigma?:
N(x;\vec\mu,\Sigma)=\sqrt{\frac{1}{(2\pi)^ndet(\Sigma)}}exp\left(-\frac{1}{2}(\vec{x}-\vec{\mu})^T\Sigma^{-1}(\vec{x}-\vec{\mu})\right)
對多為正態(tài)分布概率密度高效求值:
N(x;\vec{\mu},\vec\beta^{-1}) = \sqrt{det(\vec\beta)}{(2\pi)^n}exp\left(-\frac{1}{2}(\vec{x}-\vec\mu)^T\beta(\vec{x}-\vec\mu)\right)
此處,\vec\beta是一個精度矩陣猬腰。

指數(shù)分布

深度學(xué)習(xí)中, 指數(shù)分布用來描述在x=0?點處取得邊界點的分布, 指數(shù)分布定義如下:
p(x;\lambda)=\lambda I_{x\geq 0}exp(-\lambda{x})
指數(shù)分布用指示函數(shù)I_{x\geq 0}?來使x?取負(fù)值時的概率為零猜敢。

Laplace 分布

一個聯(lián)系緊密的概率分布是 Laplace 分布(Laplace distribution),它允許我們在任意一點 \mu處設(shè)置概率質(zhì)量的峰值
Laplace(x;\mu;\gamma)=\frac{1}{2\gamma}exp\left(-\frac{|x-\mu|}{\gamma}\right)

Dirac分布和經(jīng)驗分布

Dirac分布可保證概率分布中所有質(zhì)量都集中在一個點上. Diract分布的狄拉克\delta?函數(shù)(也稱為單位脈沖函數(shù))定義如下:
p(x)=\delta(x-\mu), x\neq \mu

\int_{a}^\delta(x-\mu)dx = 1, a < \mu < b

Dirac 分布經(jīng)常作為 經(jīng)驗分布(empirical distribution)的一個組成部分出現(xiàn)
\hat{p}(\vec{x})=\frac{1}{m}\sum_{i=1}^{m}\delta(\vec{x}-{\vec{x}}^{(i)})
, 其中, m個點x^{1},...,x^{m}是給定的數(shù)據(jù)集, 經(jīng)驗分布將概率密度\frac{1}{m}?賦給了這些點.

當(dāng)我們在訓(xùn)練集上訓(xùn)練模型時, 可以認(rèn)為從這個訓(xùn)練集上得到的經(jīng)驗分布指明了采樣來源.

適用范圍: 狄拉克δ函數(shù)適合對連續(xù)型隨機(jī)變量的經(jīng)驗分布.

期望懈费、方差博脑、協(xié)方差票罐、相關(guān)系數(shù)

期望

在概率論和統(tǒng)計學(xué)中寨闹,數(shù)學(xué)期望(或均值,亦簡稱期望)是試驗中每次可能結(jié)果的概率乘以其結(jié)果的總和沈善。它反映隨機(jī)變量平均取值的大小椭蹄。

  • 線性運算: E(ax+by+c) = aE(x)+bE(y)+c
  • 推廣形式: E(\sum_{k=1}^{n}{a_ix_i+c}) = \sum_{k=1}^{n}{a_iE(x_i)+c}
  • 函數(shù)期望:設(shè)f(x)x的函數(shù)绳矩,則f(x)的期望為
    • 離散函數(shù): E(f(x))=\sum_{k=1}^{n}{f(x_k)P(x_k)}
    • 連續(xù)函數(shù): E(f(x))=\int_{-\infty}^{+\infty}{f(x)p(x)dx}

注意:

  • 函數(shù)的期望大于等于期望的函數(shù)(Jensen不等式),即E(f(x))\geqslant f(E(x))
  • 一般情況下割以,乘積的期望不等于期望的乘積应媚。
  • 如果XY相互獨立,則E(xy)=E(x)E(y)?消玄。

方差

概率論中方差用來度量隨機(jī)變量和其數(shù)學(xué)期望(即均值)之間的偏離程度丢胚。方差是一種特殊的期望。定義為:

Var(x) = E((x-E(x))^2)

方差性質(zhì):

1)Var(x) = E(x^2) -E(x)^2
2)常數(shù)的方差為0;
3)方差不滿足線性性質(zhì);
4)如果XY相互獨立, Var(ax+by)=a^2Var(x)+b^2Var(y)

協(xié)方差

協(xié)方差是衡量兩個變量線性相關(guān)性強度及變量尺度兔跌。 兩個隨機(jī)變量的協(xié)方差定義為:
Cov(x,y)=E((x-E(x))(y-E(y)))

方差是一種特殊的協(xié)方差浮定。當(dāng)X=Y時层亿,Cov(x,y)=Var(x)=Var(y)

協(xié)方差性質(zhì):

1)獨立變量的協(xié)方差為0方灾。
2)協(xié)方差計算公式:

Cov(\sum_{i=1}^{m}{a_ix_i}, \sum_{j=1}^{m}{b_jy_j}) = \sum_{i=1}^{m} \sum_{j=1}^{m}{a_ib_jCov(x_iy_i)}

3)特殊情況:

Cov(a+bx, c+dy) = bdCov(x, y)

相關(guān)系數(shù)

相關(guān)系數(shù)是研究變量之間線性相關(guān)程度的量。兩個隨機(jī)變量的相關(guān)系數(shù)定義為:
Corr(x,y) = \frac{Cov(x,y)}{\sqrt{Var(x)Var(y)}}

相關(guān)系數(shù)的性質(zhì):
1)有界性洞慎。相關(guān)系數(shù)的取值范圍是 [-1,1]嘿棘,可以看成無量綱的協(xié)方差。
2)值越接近1焦人,說明兩個變量正相關(guān)性(線性)越強重父。越接近-1,說明負(fù)相關(guān)性越強矿辽,當(dāng)為0時郭厌,表示兩個變量沒有相關(guān)性。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末奕污,一起剝皮案震驚了整個濱河市液走,隨后出現(xiàn)的幾起案子贾陷,更是在濱河造成了極大的恐慌,老刑警劉巖巷懈,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件慌洪,死亡現(xiàn)場離奇詭異冈爹,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)频伤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來因痛,“玉大人,你說我怎么就攤上這事膊升√菲螅” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵责循,是天一觀的道長院仿。 經(jīng)常有香客問我速和,道長,這世上最難降的妖魔是什么颠放? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任碰凶,我火速辦了婚禮,結(jié)果婚禮上欲低,老公的妹妹穿的比我還像新娘。我一直安慰自己瑞筐,他們只是感情好腊瑟,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布闰非。 她就那樣靜靜地躺著,像睡著了一般财松。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上政敢,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天喷户,我揣著相機(jī)與錄音,去河邊找鬼褪尝。 笑死闹获,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的河哑。 我是一名探鬼主播避诽,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼璃谨!你這毒婦竟也來了沙庐?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤佳吞,失蹤者是張志新(化名)和其女友劉穎拱雏,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體底扳,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年衷模,在試婚紗的時候發(fā)現(xiàn)自己被綠了鹊汛。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡阱冶,死狀恐怖柒昏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情熙揍,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布氏涩,位于F島的核電站届囚,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏是尖。R本人自食惡果不足惜意系,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望饺汹。 院中可真熱鬧蛔添,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至凶硅,卻和暖如春缝裁,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背足绅。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工捷绑, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人氢妈。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓粹污,卻偏偏與公主長得像,于是被迫代替她去往敵國和親首量。 傳聞我的和親對象是個殘疾皇子壮吩,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容