名詞釋義
常用的統(tǒng)計(jì)指標(biāo) | 對(duì)應(yīng)的統(tǒng)計(jì)函數(shù) |
---|---|
最大值 | series.max() |
最小值 | series.min() |
計(jì)數(shù) | series.size |
求和 | series.sum() |
平均值 | series.mean() |
方差 | series.var() |
標(biāo)準(zhǔn)差 | series.std() |
正態(tài)分布
正態(tài)分布(Normal distribution),也稱“常態(tài)分布”剥槐,又名高斯分布
若隨機(jī)變量X服從一個(gè)數(shù)學(xué)期望為μ唱歧、方差為σ2的正態(tài)分布,記為N(μ粒竖,σ2)颅崩。其概率密度函數(shù)為正態(tài)分布的期望值μ決定了其位置,其標(biāo)準(zhǔn)差σ決定了分布的幅度蕊苗。當(dāng)μ = 0,σ = 1時(shí)的正態(tài)分布是標(biāo)準(zhǔn)正態(tài)分布沿后。
定理
由于一般的正態(tài)總體其圖像不一定關(guān)于y軸對(duì)稱,對(duì)于任一正態(tài)總體朽砰,其取值小于x的概率尖滚。只要會(huì)用它求正態(tài)總體在某個(gè)特定區(qū)間的概率即可。
為了便于描述和應(yīng)用瞧柔,常將正態(tài)變量作數(shù)據(jù)轉(zhuǎn)換漆弄。將一般正態(tài)分布轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)分布。 [1]
若
服從標(biāo)準(zhǔn)正態(tài)分布,通過查標(biāo)準(zhǔn)正態(tài)分布表就可以直接計(jì)算出原正態(tài)分布的概率值造锅。故該變換被稱為標(biāo)準(zhǔn)化變換撼唾。(標(biāo)準(zhǔn)正態(tài)分布表:標(biāo)準(zhǔn)正態(tài)分布表中列出了標(biāo)準(zhǔn)正態(tài)曲線下從-∞到X(當(dāng)前值)范圍內(nèi)的面積比例。)
定義
一維正態(tài)分布
服從一個(gè)位置參數(shù)為
哥蔚、尺度參數(shù)為
的概率分布倒谷,且其概率密度函數(shù)為 [2]
則這個(gè)隨機(jī)變量就稱為正態(tài)隨機(jī)變量蛛蒙,正態(tài)隨機(jī)變量服從的分布就稱為正態(tài)分布,記作
渤愁,讀作
服從
宇驾,或
服從正態(tài)分布。
μ維隨機(jī)向量具有類似的概率規(guī)律時(shí)猴伶,稱此隨機(jī)向量遵從多維正態(tài)分布课舍。多元正態(tài)分布有很好的性質(zhì),例如他挎,多元正態(tài)分布的邊緣分布仍為正態(tài)分布筝尾,它經(jīng)任何線性變換得到的隨機(jī)向量仍為多維正態(tài)分布,特別它的線性組合為一元正態(tài)分布办桨。
本詞條的正態(tài)分布是一維正態(tài)分布筹淫,此外多維正態(tài)分布參見“二維正態(tài)分布”。
標(biāo)準(zhǔn)正態(tài)分布
當(dāng)
時(shí)呢撞,正態(tài)分布就成為標(biāo)準(zhǔn)正態(tài)分布
性質(zhì)
[編輯](javascript:;)
正態(tài)分布的一些性質(zhì): [2]
(1)如果
且a與b是實(shí)數(shù)损姜,那么
(2)如果
與
是統(tǒng)計(jì)獨(dú)立的正態(tài)隨機(jī)變量殊霞,那么:
它們的和也滿足正態(tài)分布
它們的差也滿足正態(tài)分布
U與V兩者是相互獨(dú)立的摧阅。(要求X與Y的方差相等)。
(3)如果
和
是獨(dú)立常態(tài)隨機(jī)變量绷蹲,那么:
它們的積XY服從概率密度函數(shù)為p的分布
其中
是修正貝塞爾函數(shù)(modified Bessel function)
它們的比符合柯西分布棒卷,滿足
(4)如果
為獨(dú)立標(biāo)準(zhǔn)常態(tài)隨機(jī)變量,那么
服從自由度為n的卡方分布祝钢。
分布曲線
圖形特征
****集中性:正態(tài)曲線的高峰位于正中央比规,即均數(shù)所在的位置。
對(duì)稱性:正態(tài)曲線以均數(shù)為中心拦英,左右對(duì)稱蜒什,曲線兩端永遠(yuǎn)不與橫軸相交。
均勻變動(dòng)性:正態(tài)曲線由均數(shù)所在處開始疤估,分別向左右兩側(cè)逐漸均勻下降灾常。
曲線與橫軸間的面積總等于1,相當(dāng)于概率密度函數(shù)的函數(shù)從正無窮到負(fù)無窮積分的概率為1做裙。即頻率的總和為100%岗憋。
[]
關(guān)于μ對(duì)稱肃晚,并在μ處取最大值锚贱,在正(負(fù))無窮遠(yuǎn)處取值為0,在μ±σ處有拐點(diǎn)关串,形狀呈現(xiàn)中間高兩邊低拧廊,正態(tài)分布的概率密度函數(shù)曲線呈鐘形监徘,因此人們又經(jīng)常稱之為鐘形曲線。
參數(shù)含義
正態(tài)分布有兩個(gè)參數(shù)吧碾,即期望(均數(shù))μ和標(biāo)準(zhǔn)差σ凰盔,σ2為方差。
[]
正態(tài)分布具有兩個(gè)參數(shù)μ和σ2的[連續(xù)型隨機(jī)變量]的分布倦春,第一參數(shù)μ是服從正態(tài)分布的隨機(jī)變量的[均值]户敬,第二個(gè)參數(shù)σ2是此隨機(jī)變量的方差,所以正態(tài)分布記作N(μ,σ2)睁本。
μ是正態(tài)分布的位置參數(shù)尿庐,描述正態(tài)分布的集中趨勢(shì)位置。概率規(guī)律為取與μ鄰近的值的概率大呢堰,而取離μ越遠(yuǎn)的值的概率越小抄瑟。正態(tài)分布以X=μ為對(duì)稱軸,左右完全對(duì)稱枉疼。正態(tài)分布的期望皮假、均數(shù)、中位數(shù)骂维、眾數(shù)相同惹资,均等于μ。
σ描述正態(tài)分布資料數(shù)據(jù)分布的離散程度航闺,σ越大布轿,數(shù)據(jù)分布越分散,σ越小来颤,數(shù)據(jù)分布越集中汰扭。也稱為是正態(tài)分布的形狀參數(shù),σ越大福铅,曲線越扁平萝毛,反之,σ越小滑黔,曲線越瘦高笆包。
面積分布
1、實(shí)際工作中略荡,正態(tài)曲線下橫軸上一定區(qū)間的面積反映該區(qū)間的例數(shù)占總例數(shù)的百分比庵佣,或變量值落在該區(qū)間的概率(概率分布)。不同 范圍內(nèi)正態(tài)曲線下的面積可用公式計(jì)算汛兜。
2巴粪、正態(tài)曲線下,橫軸區(qū)間(μ-σ,μ+σ)內(nèi)的面積為68.268949%。
P{|X-μ|<σ}=2Φ(1)-1=0.6826
橫軸區(qū)間(μ-1.96σ,μ+1.96σ)內(nèi)的面積為95.449974%肛根。
P{|X-μ|<2σ}=2Φ(2)-1=0.9544
橫軸區(qū)間(μ-2.58σ,μ+2.58σ)內(nèi)的面積為99.730020%辫塌。
P{|X-μ|<3σ}=2Φ(3)-1=0.9974
由于“小概率事件”和假設(shè)檢驗(yàn)的基本思想 “小概率事件”通常指發(fā)生的概率小于5%的事件,認(rèn)為在一次試驗(yàn)中該事件是幾乎不可能發(fā)生的派哲。由此可見X落在(μ-3σ,μ+3σ)以外的概率小于千分之三臼氨,在實(shí)際問題中常認(rèn)為相應(yīng)的事件是不會(huì)發(fā)生的,基本上可以把區(qū)間(μ-3σ,μ+3σ)看作是隨機(jī)變量X實(shí)際可能的取值區(qū)間芭届,這稱之為正態(tài)分布的“3σ”原則储矩。