基礎(chǔ)概念
1.概率
概率直觀上是指一個事件發(fā)生可能性大小的數(shù)量指標(biāo)
概率的統(tǒng)計定義:在不變的條件下漓库,重復(fù)進(jìn)行nn次試驗施敢,事件AA發(fā)生的頻率穩(wěn)定在某一個常數(shù)pp附近擺動驹溃,且一般來說垄分,nn越大付呕,擺動幅度越小计福,則稱常數(shù)pp為事件AA的概率,記作P(A)=pP(A)=p.
2.古典概型
當(dāng)試驗結(jié)果為有限nn個樣本點徽职,且每個樣本點的發(fā)生具有相等的可能性象颖,如果事件A由nAnA個樣本點組成,則事件AA的概率
P(A)=nAnP(A)=nAn
稱有限等可能實驗中事件AA的概率P(A)P(A)為古典概率.
4.隨機變量
定義:在樣本空間ΩΩ上的實值函數(shù)X=X(ω),ω∈ΩX=X(ω),ω∈Ω姆钉,稱X(ω)X(ω)為隨機變量说订,簡記XX.
4.1?離散型隨機變量
離散型(discrete)隨機變量即在一定區(qū)間內(nèi)變量取值為有限個或可數(shù)個抄瓦。
4.2 連續(xù)型隨機變量
連續(xù)型(continuous)隨機變量即在一定區(qū)間內(nèi)變量取值有無限個,或數(shù)值無法一一列舉出來陶冷。
定義:如果對隨機變量XX的分布函數(shù)F(x)F(x)钙姊,存在一個非負(fù)可積函數(shù)f(x)f(x),使得對任意實數(shù)xx埂伦,都有
F(X)=∫x?∞f(t)dt,?∞<x<+∞F(X)=∫?∞xf(t)dt,?∞
稱XX為連續(xù)型隨機變量煞额,函數(shù)f(x)f(x)稱為XX的概率密度。
4.3 期望
離散型
如果XX是離散隨機變量赤屋,具有概率質(zhì)量函數(shù)p(x)p(x)立镶,那么X的期望值定義為E(X)=∑x:p(x)>0xp(x)E(X)=∑x:p(x)>0xp(x)。換句話說类早,XX的期望是XX可能取的值的加權(quán)平均媚媒,每個值被XX取此值的概率所加權(quán)。
連續(xù)型
我們也可以定義連續(xù)隨機變量的期望值涩僻。如果XX是具有概率密度函數(shù)f(x)f(x)的連續(xù)隨機變量缭召,那么XX的期望就定義為E(X)=∫βαxβ?αdx=β2?α22(β?α)=β+α2E(X)=∫αβxβ?αdx=β2?α22(β?α)=β+α2。換句話說逆日,在(α,β)(α,β)上均勻分布的隨機變量的期望值正是區(qū)間的中點嵌巷。
常用概率分布
1.二項分布
nn重伯努利試驗
定義:把一隨機試驗獨立重復(fù)作若干,即各次試驗所聯(lián)系的事件之間相互獨立室抽,且同一事件在各個實驗中出現(xiàn)的概率相同搪哪,稱為獨立重復(fù)試驗。
如果每次試驗只有兩個結(jié)果AA和AˉˉˉˉAˉ坪圾,則稱這種試驗為伯努利試驗晓折。將伯努利試驗獨立重復(fù)nn次,稱為nn重伯努利試驗兽泄。
設(shè)在每次試驗中漓概,概率P(A)=p(0<p<1)P(A)=p(0
二項分布
如果隨機變量XX有分布律
P{X=k}=Cknpk(1?p)n?k,k=0,1,2,?,nP{X=k}=Cnkpk(1?p)n?k,k=0,1,2,?,n
其中0<p<1,q=1?p0
二項分布就是重復(fù)nn次獨立的伯努利試驗病梢。在nn次伯努利試驗中胃珍,若每次試驗成功率p(0<p<1)p(0
當(dāng)n=1n=1時,二項分布為0?10?1分布蜓陌,記B(1,p)B(1,p)
期望:E(gX)=npE(gX)=np觅彰,方差:D(X)=np(1?p)D(X)=np(1?p)
2.泊松分布
泊松分布的概率函數(shù)為:
P(X=k)=λkk!e?λ,k=0,1,?P(X=k)=λkk!e?λ,k=0,1,?
泊松分布的參數(shù)λλ是單位時間(或單位面積)內(nèi)隨機事件的平均發(fā)生次數(shù)。 泊松分布適合于描述單位時間內(nèi)隨機事件發(fā)生的次數(shù)护奈。
泊松分布的期望和方差均為λλ特征函數(shù)為ψ(t)=exp{λ(eit?1)}ψ(t)=exp?{λ(eit?1)}
泊松分布適合于描述單位時間(或空間)內(nèi)隨機事件發(fā)生的次數(shù)缔莲。如某一服務(wù)設(shè)施在一定時間內(nèi)到達(dá)的人數(shù),電話交換機接到呼叫的次數(shù)霉旗,汽車站臺的候客人數(shù)痴奏,機器出現(xiàn)的故障數(shù),自然災(zāi)害發(fā)生的次數(shù)厌秒,一塊產(chǎn)品上的缺陷數(shù)读拆,顯微鏡下單位分區(qū)內(nèi)的細(xì)菌分布數(shù)等等
3.均勻分布
在概率論和統(tǒng)計學(xué)中,均勻分布也叫矩形分布鸵闪,它是對稱概率分布檐晕,在相同長度間隔的分布概率是等可能的。 均勻分布由兩個參數(shù)aa和bb定義蚌讼,它們是數(shù)軸上的最小值和最大值辟灰,通常縮寫為U(a篡石,b)U(a芥喇,b).
概率密度函數(shù):
f(x)={1b?a,0a<x<b其他]f(x)={1b?a,a
在兩個邊界aa和bb處的f(x)f(x)的值通常是不重要的,因為它們不改變?nèi)魏蝔(x)dxf(x)dx的積分值凰萨。 概率密度函數(shù)有時為0继控,有時為1b?a1b?a。 在傅里葉分析的概念中胖眷,可以將f(a)f(a)或f(b)f(b)的值取為12(b?a)12(b?a)武通,因為這種均勻函數(shù)的許多積分變換的逆變換都是函數(shù)本身。
分布函數(shù):
F(x)=?????0,1b?a,1,x<aa≤x<bb≤xF(x)={0,x
令X1,…,XnX1,…,Xn是服從于U(0,1)U(0,1)的樣本珊搀。 令X(k)X(k)為該樣本的第kk次統(tǒng)計量冶忱。 那么X(k)X(k)的概率分布是參數(shù)為kk和n?k+1n?k+1的β分布。期望值是:
E(X(k))=kn+1E(X(k))=kn+1
方差是:
V(X(k))=k(n?k+1)(n+1)2(n+2)V(X(k))=k(n?k+1)(n+1)2(n+2)
4.指數(shù)分布
在概率理論和統(tǒng)計學(xué)中境析,指數(shù)分布(也稱為負(fù)指數(shù)分布)是描述泊松過程中的事件之間的時間的概率分布囚枪,即事件以恒定平均速率連續(xù)且獨立地發(fā)生的過程。 這是伽馬分布的一個特殊情況簿晓。 它是幾何分布的連續(xù)模擬眶拉,它具有無記憶的關(guān)鍵性質(zhì)。
隨機變量XX概率密度函數(shù):
f(x)={λe?λx,0,x>0x≤0λ>0f(x)={λe?λx,x>00,x≤0λ>0
設(shè)X~E(λ)X~E(λ)憔儿,則XX的分布函數(shù):
F(x)={1?e?λx,0,x>0,x≤0,λ>0F(x)={1?e?λx,x>0,0,x≤0,λ>0
期望值:E(X)=1λE(X)=1λ
方差:D(X)=Var(X)=1λ2D(X)=Var?(X)=1λ2
指數(shù)分布是一種連續(xù)概率分布忆植。指數(shù)分布可以用來表示獨立隨機事件發(fā)生的時間間隔,比如旅客進(jìn)機場的時間間隔谒臼、中文維基百科新條目出現(xiàn)的時間間隔等
5.正態(tài)分布
若隨機變量XX服從一個位置參數(shù)為μμ朝刊、尺度參數(shù)為σσ的概率分布,且其概率密度函數(shù)為
f(x)=12π√σexp(?(x?μ)22σ2)f(x)=12πσexp?(?(x?μ)22σ2)
則這個隨機變量就稱為正態(tài)隨機變量蜈缤,正態(tài)隨機變量服從的分布就稱為正態(tài)分布拾氓,記作X~N(μ,σ2)X~N(μ,σ2),讀作服從N(μ,σ2)N(μ,σ2)底哥,或XX服從正態(tài)分布咙鞍。
參數(shù)含義
正態(tài)分布有兩個參數(shù)畜号,即期望(均數(shù))μμ和標(biāo)準(zhǔn)差σσ,σ2σ2為方差沃缘。
f(x)=12π√σe?(x?μ)22σ2f(x)=12πσe?(x?μ)22σ2
正態(tài)分布具有兩個參數(shù)μμ和σ2σ2的連續(xù)型隨機變量的分布谜悟,第一參數(shù)μμ是服從正態(tài)分布的隨機變量的均值,第二個參數(shù)σ2σ2是此隨機變量的方差疲酌,所以正態(tài)分布記作N(μ,σ2)N(μ,σ2).
μμ是正態(tài)分布的位置參數(shù)蜡峰,描述正態(tài)分布的集中趨勢位置。概率規(guī)律為取與μμ鄰近的值的概率大朗恳,而取離μμ越遠(yuǎn)的值的概率越小湿颅。正態(tài)分布以X=μX=μ為對稱軸,左右完全對稱粥诫。正態(tài)分布的期望油航、均數(shù)、中位數(shù)臀脏、眾數(shù)相同劝堪,均等于μμ。
當(dāng)μ=0,σ=1μ=0,σ=1時揉稚,正態(tài)分布就成為標(biāo)準(zhǔn)正態(tài)分布
f(x)=12π√e(?x22)f(x)=12πe(?x22)
概率論中最重要的分布
正態(tài)分布有極其廣泛的實際背景秒啦,生產(chǎn)與科學(xué)實驗中很多隨機變量的概率分布都可以近似地用正態(tài)分布來描述。例如搀玖,在生產(chǎn)條件不變的情況下余境,產(chǎn)品的強力、抗壓強度灌诅、口徑芳来、長度等指標(biāo);同一種生物體的身長猜拾、體重等指標(biāo)即舌;同一種種子的重量;測量同一物體的誤差挎袜;彈著點沿某一方向的偏差顽聂;某個地區(qū)的年降水量;以及理想氣體分子的速度分量盯仪,等等紊搪。一般來說,如果一個量是由許多微小的獨立隨機因素影響的結(jié)果全景,那么就可以認(rèn)為這個量具有正態(tài)分布(見中心極限定理)耀石。從理論上看,正態(tài)分布具有很多良好的性質(zhì) 爸黄,許多概率分布可以用它來近似滞伟;還有一些常用的概率分布是由它直接導(dǎo)出的揭鳞,例如對數(shù)正態(tài)分布、t分布诗良、F分布等
6.χ2χ2分布
若n個相互獨立的隨機變量ξ?汹桦、ξ?鲁驶、……鉴裹、ξn ,均服從標(biāo)準(zhǔn)正態(tài)分布(也稱獨立同分布于標(biāo)準(zhǔn)正態(tài)分布)钥弯,則這nn個服從標(biāo)準(zhǔn)正態(tài)分布的隨機變量的平方和Q=∑ni=1ξ2iQ=∑i=1nξi2構(gòu)成一新的隨機變量径荔,其分布規(guī)律稱為χ2χ2分布(chi-square distribution),其中參數(shù)稱為自由度脆霎,正如正態(tài)分布中均數(shù)或方差不同就是另一個正態(tài)分布一樣总处,自由度不同就是另一個χ2χ2分布。記為Q~χ2(v)Q~χ2(v)或者Q~χ2vQ~χv2(其中v=n?k睛蛛,kv=n?k鹦马,k為限制條件數(shù))。
卡方分布是由正態(tài)分布構(gòu)造而成的一個新的分布忆肾,當(dāng)自由度很大時荸频,χ2χ2分布近似為正態(tài)分布。
7.Beta分布
在概率論中客冈,貝塔分布旭从,也稱B分布,是指一組定義在(0,1)(0,1)區(qū)間的連續(xù)概率分布场仲,有兩個參數(shù)α,β>0α,β>0和悦。
B分布的概率分布函數(shù)為:
f(x;α,β)=xα?1(1?x)β?1∫10uα?1(1?u)β?1du=Γ(α+β)Γ(α)Γ(β)xα?1(1?x)β?1=1B(α,β)xα?1(1?x)β?1f(x;α,β)=xα?1(1?x)β?1∫01uα?1(1?u)β?1du=Γ(α+β)Γ(α)Γ(β)xα?1(1?x)β?1=1B(α,β)xα?1(1?x)β?1
其中Γ(z)Γ(z)是ΓΓ函數(shù)。隨機變量XX服從參數(shù)為α,βα,β的Β分布通常寫作X~Be(α,β)X~Be?(α,β)
性質(zhì):
1. 參數(shù)為α,βα,β貝塔分布的眾數(shù)是:
α?1α+β?2α?1α+β?2
2.期望值和方差分別是:
μ=E(X)=αα+βμ=E(X)=αα+β
Var(X)=E(X?μ)2=αβ(α+β)2(α+β+1)Var?(X)=E(X?μ)2=αβ(α+β)2(α+β+1)
3.偏度是:
E(X?μ)3[E(X?μ)2]3/2=2(β?α)α+β+1√(α+β+2)αβ√E(X?μ)3[E(X?μ)2]3/2=2(β?α)α+β+1(α+β+2)αβ
4.峰度是:
E(X?μ)4[E(X?μ)2]2?3=6[α3?α2(2β?1)+β2(β+1)?2αβ(β+2)]αβ(α+β+2)(α+β+3)E(X?μ)4[E(X?μ)2]2?3=6[α3?α2(2β?1)+β2(β+1)?2αβ(β+2)]αβ(α+β+2)(α+β+3)
或:
6[(α?β)2(α+β+1)?αβ(α+β+2)]αβ(α+β+2)(α+β+3)