說(shuō)起二項(xiàng)分布(binomial distribution)掠拳,不得不提的前提是伯努利試驗(yàn)(Bernoulli experiment)癞揉,也即n次獨(dú)立重復(fù)試驗(yàn)。伯努利試驗(yàn)是在同樣的條件下重復(fù)溺欧、相互獨(dú)立進(jìn)行的一種隨機(jī)試驗(yàn)喊熟。
? ?伯努利試驗(yàn)的特點(diǎn)是:
(1)每次試驗(yàn)中事件只有兩種結(jié)果:事件發(fā)生或者不發(fā)生,如硬幣正面或反面姐刁,患病或沒(méi)患惭芬啤;
(2)每次試驗(yàn)中事件發(fā)生的概率是相同的龙填,注意不一定是0.5胳泉;
(3)n次試驗(yàn)的事件相互之間獨(dú)立。
? ?舉個(gè)實(shí)例岩遗,最簡(jiǎn)單的拋硬幣試驗(yàn)就是伯努利試驗(yàn)扇商,在一次試驗(yàn)中硬幣要么正面朝上,要么反面朝上宿礁,每次正面朝上的概率都一樣p=0.5案铺,且每次拋硬幣的事件相互獨(dú)立,即每次正面朝上的概率不受其他試驗(yàn)的影響梆靖。如果獨(dú)立重復(fù)拋n=10次硬幣控汉,正面朝上的次數(shù)k可能為0,1,2,3,4,5,6,7,8,9,10中的任何一個(gè),那么k顯然是一個(gè)隨機(jī)變量返吻,這里就稱隨機(jī)變量k服從二項(xiàng)分布姑子。
我們推導(dǎo)下隨機(jī)變量X=k的分布律。顯然0<=k<=n测僵,n次拋硬幣中獲得k次正面街佑,第1次正面在n次拋硬幣中出現(xiàn)有n種方式,則第2次正面在n次拋硬幣中出現(xiàn)有n-1種方式捍靠,以此類推沐旨,則出現(xiàn)的總可能方式是:n(n-1)...(n-k+1)種,如果我們并不考慮這k次正面出現(xiàn)的排列順序榨婆,因此恰好出現(xiàn)k次的總可能性是n(n-1)...(n-k+1)/k磁携!種,分子和分母同時(shí)乘以(n-k)良风!谊迄,則該式等于n闷供!/(k!*(n-k)鳞上!),也就是通常的組合公式C(n,k)=n吊档!/(k篙议!*(n-k)!)怠硼。
那么對(duì)于拋n次硬幣鬼贱,其中正面出現(xiàn)的次數(shù)是k,反面出現(xiàn)的次數(shù)必然為n-k次香璃,不考慮順序的情況下这难,則每一次恰好獲得k次正面的概率是pk*(1-p)n-k,而n次試驗(yàn)中恰好出現(xiàn)k次正面的可能性是C(n,k)=n葡秒!/(k姻乓!*(n-k)!)種眯牧,因此蹋岩,n次拋硬幣中恰好出現(xiàn)k次的概率為
P(X=k) = C(n,k) * pk*(1-p)n-k
這就是二項(xiàng)分布的分布律,記作X~B(n,p)学少,其中C(n,k)是組合數(shù)剪个,在數(shù)學(xué)中也叫二項(xiàng)式系數(shù),這就是二項(xiàng)分布名稱的來(lái)歷版确。判斷某個(gè)隨機(jī)變量X是否符合二項(xiàng)分布除了滿足上述的伯努利試驗(yàn)外扣囊,關(guān)鍵是這個(gè)X是否表示事件發(fā)生的次數(shù)。二項(xiàng)分布的數(shù)學(xué)期望E(X)=n*p绒疗,方差D(X)=n*p*(1-p)侵歇,具體證明可見(jiàn)《二項(xiàng)分布均值和方差的簡(jiǎn)單推導(dǎo)》。
看一個(gè)示例:某人籃球投籃的命中率是0.3吓蘑,總共投籃10次盒至,問(wèn)至少投中2次的概率?
分析:
(1)每次投籃有2種結(jié)果,投中或沒(méi)投中士修;
(2)每次投籃的投中概率是相同的枷遂,都為0.3;
(3)每次投籃可認(rèn)為是獨(dú)立事件棋嘲。
因此酒唉,符合二項(xiàng)分布。
顯然沸移,二項(xiàng)分布屬于離散型分布痪伦。
至少2次投中概率即:P(X>=2)=P(X=2)+P(X=3)+P(X=4)+...+P(X=10)侄榴。
輸出結(jié)果:0.85
? ?再看一個(gè)例子:某種疫苗注射后過(guò)敏反應(yīng)的概率是0.08,問(wèn)某社區(qū)衛(wèi)生院在接種該疫苗100人后网沾,少于3人有過(guò)敏反應(yīng)的概率是多少癞蚕?
采用上例中的分析方法,該問(wèn)題也屬于二項(xiàng)分布問(wèn)題辉哥。少于3人有過(guò)敏反應(yīng)桦山,即求:
P(X<3)=P(X=0)+P(X=1)+P(X=2)=C(100,0)(0.08)0(0.02)100+C(100,1)(0.08)1(0.02)99+C(100,2)(0.08)2(0.02)98=0.01127=1.127%
? ?在實(shí)際應(yīng)用中還有伯努利分布、兩點(diǎn)分布醋旦、0-1分布等恒水,它們與二項(xiàng)分布之間有什么關(guān)系呢?
X~B(n,p)饲齐,當(dāng)n = 1時(shí)钉凌,二項(xiàng)分布就變成了伯努利分布(Bernoulli distribution),伯努利分布又稱為“兩點(diǎn)分布”或“0-1分布”捂人,或者說(shuō)伯努利分布/兩點(diǎn)分布/0-1分布是二項(xiàng)分布在n=1時(shí)的特例御雕,即伯努利分布、兩點(diǎn)分布滥搭、0-1分布這三種分布是同一個(gè)分布的不同名稱饮笛,又都是二項(xiàng)分布在n=1時(shí)的特例。
泊松概率分布
泊松概率是另外一個(gè)常用的離散型隨機(jī)變量论熙,它主要用于估計(jì)某事件在特定時(shí)間或空間中發(fā)生的次數(shù)福青。比如一天內(nèi)中獎(jiǎng)的個(gè)數(shù),一個(gè)月內(nèi)某機(jī)器損壞的次數(shù)等脓诡。
泊松概率的成立條件是在任意兩個(gè)長(zhǎng)度相等的區(qū)間中无午,時(shí)間發(fā)生的概率是相同的,并且事件是否發(fā)生都是相互獨(dú)立的祝谚。
泊松概率既然表示事件在一個(gè)區(qū)間發(fā)生的次數(shù)宪迟,這里的次數(shù)就不會(huì)有上限,x取值可以無(wú)限大交惯,只是可能性無(wú)限接近0次泽,f(x)的最終值很小。
泊松概率還有一個(gè)重要性質(zhì)席爽,它的數(shù)學(xué)期望和方差相等意荤。
讓我們先通過(guò)一個(gè)例子,了解什么是"泊松分布"只锻。
已知某家小雜貨店玖像,平均每周售出2個(gè)水果罐頭。請(qǐng)問(wèn)該店水果罐頭的最佳庫(kù)存量是多少齐饮?
假定不存在季節(jié)因素捐寥,可以近似認(rèn)為笤昨,這個(gè)問(wèn)題滿足以下三個(gè)條件:
(1)顧客購(gòu)買水果罐頭是小概率事件。
(2)購(gòu)買水果罐頭的顧客是獨(dú)立的握恳,不會(huì)互相影響瞒窒。
(3)顧客購(gòu)買水果罐頭的概率是穩(wěn)定的。
在統(tǒng)計(jì)學(xué)上乡洼,只要某類事件滿足上面三個(gè)條件崇裁,它就服從"泊松分布"。
各個(gè)參數(shù)的含義:
P:每周銷售k個(gè)罐頭的概率就珠。
X:水果罐頭的銷售變量寇壳。
k:X的取值(0醒颖,1妻怎,2,3...)泞歉。
λ:每周水果罐頭的平均銷售量逼侦,是一個(gè)常數(shù),本題為2腰耙。
從上表可見(jiàn)榛丢,如果存貨4個(gè)罐頭,95%的概率不會(huì)缺貨(平均每19周發(fā)生一次)挺庞;如果存貨5個(gè)罐頭晰赞,98%的概率不會(huì)缺貨(平均59周發(fā)生一次)。
泊松分布適合于描述單位時(shí)間內(nèi)隨機(jī)事件發(fā)生的次數(shù)的概率分布选侨。如某一服務(wù)設(shè)施在一定時(shí)間內(nèi)受到的服務(wù)請(qǐng)求的次數(shù)掖鱼,電話交換機(jī)接到呼叫的次數(shù)、汽車站臺(tái)的候客人數(shù)援制、機(jī)器出現(xiàn)的故障數(shù)戏挡、自然災(zāi)害發(fā)生的次數(shù)、DNA序列的變異數(shù)晨仑、放射性原子核的衰變數(shù)褐墅,宇宙中單位體積內(nèi)星球的個(gè)數(shù) ,耕地上單位面積內(nèi)雜草的數(shù)目等 洪己。