知乎:泊松分布 (Poisson Distributions) 的推導(dǎo)&二項(xiàng)分布恐锦、泊松分布到底該如何近似計(jì)算?
阮一峰:泊松分布和指數(shù)分布:10分鐘教程 和 泊松分布與美國(guó)槍擊案
非嚴(yán)格定義(此處更多的是基于自己的理解)
看了很多文章對(duì)于泊松分布的介紹都提到了這樣幾句話
- 泊松分布是二項(xiàng)分布的極限情況
- 如果試驗(yàn)次數(shù)n很大疆液,二項(xiàng)分布的概率p很小一铅,且乘積λ= np比較適中,則事件出現(xiàn)的次數(shù)的概率可以用泊松分布來逼近
這兩句話開始帶給我一個(gè)極大的迷惑性堕油,所謂的極限情況具體是什么潘飘,"很大","很小","比較適中"這幾個(gè)詞所表示的含義真的是很模糊
目前為止我是這樣理解這幾句話的,我們?cè)谶M(jìn)行任何實(shí)驗(yàn)時(shí)都會(huì)選定一個(gè)觀測(cè)的基本度量區(qū)間馍迄,例如一次拋硬幣實(shí)驗(yàn)福也,一天嬰兒出生個(gè)數(shù),一個(gè)小時(shí)通過的車輛攀圈,這里的一次暴凑、一天、一個(gè)小時(shí)就是我所說的基本度量區(qū)間赘来。
在這個(gè)基本區(qū)間內(nèi)现喳,實(shí)驗(yàn)的結(jié)果可以認(rèn)為是恒定的,即一次伯努利試驗(yàn)的概率p可以計(jì)算出來犬辰,但如果我們把這個(gè)區(qū)間劃分為無窮個(gè)小區(qū)間嗦篱,即n—>∞,那么p—>0幌缝,那么λ=np就可以理解了
暫時(shí)拋開這個(gè)大區(qū)間的劃分灸促,我們從這個(gè)無窮小的區(qū)間來觀察問題
其實(shí)類似求在n個(gè)小時(shí)內(nèi),出生嬰兒為k個(gè)的概率涵卵,依然可以以二項(xiàng)分布的概念來理解浴栽,雖然看起來不像拋硬幣那么直觀
我們把時(shí)間劃分為n個(gè)無限小的時(shí)間點(diǎn),大小為w,那么n個(gè)小時(shí)轿偎,就等于進(jìn)行了N=n/w次伯努利實(shí)驗(yàn)典鸡,每次結(jié)果要么是出生,要么是不出生坏晦,雖然此時(shí)的出生概率pi無限趨近于0萝玷,那么求上面問題嫁乘,就成了一個(gè)很直觀的求二項(xiàng)分布的問題,我想也即可以理解某些文章說的泊松分布把離散的伯努利實(shí)驗(yàn)變?yōu)榱诉B續(xù)
這樣看起來的話球碉,任何求概率的問題其實(shí)都是用二項(xiàng)分布的概率質(zhì)量函數(shù)來計(jì)算蜓斧,但實(shí)際這根本不可能求的出來,做上述統(tǒng)計(jì)的統(tǒng)計(jì)時(shí),根本不可能統(tǒng)計(jì)一個(gè)無限小的時(shí)間點(diǎn)上發(fā)生事件的概率汁尺,所以我們還得從大區(qū)間(即上面說的基本度量區(qū)間)的角度來統(tǒng)計(jì)問題法精,仔細(xì)思考泊松分布的推導(dǎo),它就是采用求極限的方式把從這個(gè)無限小的區(qū)間內(nèi)求解問題轉(zhuǎn)化為從大區(qū)間來求解痴突,即只使用基本度量區(qū)間的期望值來求解
但因?yàn)槭乔髽O限搂蜓,所以也就有了上面的疑惑的第二句話的答案,試驗(yàn)次數(shù)n越大辽装,二項(xiàng)分布的概率p越小,泊松分布就越逼近二項(xiàng)分布
(此處疑問帮碰,到底多大算大,多小算小拾积,上面給出的張老師的文章有講解殉挽,但表格我暫時(shí)沒太看懂)
公式推導(dǎo)
知乎那篇文章,是我看到的覺得最好的一篇關(guān)于泊松分布的文章拓巧,所以就不重復(fù)的貼公式了
補(bǔ)充幾個(gè)當(dāng)時(shí)看了有些疑惑的地方:
關(guān)于這串公式的轉(zhuǎn)換過程中二項(xiàng)式系數(shù)從第二步到第三步的轉(zhuǎn)換斯碌,注意分母要用分?jǐn)?shù)的乘法法則,而不是加法法則肛度,這屬于當(dāng)時(shí)我看的時(shí)候腦袋沒轉(zhuǎn)過彎來傻唾,不過我看原文評(píng)論里有個(gè)人和我有同樣的疑惑,所以在這里就貼一下
再就是
我想換成
更好理解一些