【理論】概率分布
基本概念:
隨機(jī)變量剥槐;古典概率;條件概率宪摧;離散變量粒竖;連續(xù)變量颅崩;期望值
離散變量概率分布
二項(xiàng)分布;伯努利分布蕊苗;泊松分布
連續(xù)變量概率分布
均勻分布沿后;正態(tài)分布;指數(shù)分布朽砰;伽瑪分布尖滚;偏態(tài)分布;貝塔分布瞧柔;威布爾分布漆弄;卡方分布;F分布
一非剃、基本概念
隨機(jī)變量:
隨機(jī)變量(random variable)表示隨機(jī)試驗(yàn)各種結(jié)果的實(shí)值單值函數(shù)置逻。簡(jiǎn)單地說(shuō),隨機(jī)變量是指隨機(jī)事件的數(shù)量表現(xiàn)备绽。例如一批注入某種毒物的動(dòng)物券坞,在一定時(shí)間內(nèi)死亡的只數(shù);某地若干名男性健康成人中肺素,每人血紅蛋白量的測(cè)定值恨锚;等等。
古典概率:
古典概率通常又叫事前概率倍靡,是指當(dāng)隨機(jī)事件中各種可能發(fā)生的結(jié)果及其出現(xiàn)的次數(shù)都可以由演繹或外推法得知猴伶,而無(wú)需經(jīng)過任何統(tǒng)計(jì)試驗(yàn)即可計(jì)算各種可能發(fā)生結(jié)果的概率。
因?yàn)楣诺涫录慕Y(jié)果數(shù)目已知塌西,且每種結(jié)果對(duì)應(yīng)的發(fā)生概率相等他挎。例如扔骰子,不管如何扔捡需,出現(xiàn)某個(gè)點(diǎn)數(shù)的概率等于1/6
條件概率:
條件概率是指事件A在事件B發(fā)生的條件下發(fā)生的概率办桨。條件概率表示為:P(A|B),讀作“A在B發(fā)生的條件下發(fā)生的概率”站辉。若只有兩個(gè)事件A呢撞,B,那么變量
離散變量
連續(xù)變量
期望值
期望值是隨機(jī)試驗(yàn)在同樣的機(jī)會(huì)下重復(fù)多次的結(jié)果計(jì)算出的等同“期望”的平均值饰剥。
二殊霞、離散變量概率分布
二項(xiàng)分布
二項(xiàng)分布是由伯努利提出的概念,指的是重復(fù)n次獨(dú)立的伯努利試驗(yàn)汰蓉,發(fā)生的結(jié)果只有兩個(gè)绷蹲。
特點(diǎn):
1.每次試驗(yàn)只有兩種可能得結(jié)果:“成功”與“失敗”,兩個(gè)結(jié)果只會(huì)出現(xiàn)一個(gè)古沥;
2.每次試驗(yàn)前瘸右,如果“成功”的概率是p娇跟,那么“失敗”的概率是(1-p)岩齿;
3.每次試驗(yàn)相互獨(dú)立太颤,每次試驗(yàn)結(jié)果不受其他各次試驗(yàn)結(jié)果的影響
伯努利分布
伯努利分布是二項(xiàng)分布在n=1時(shí)的特例.
伯努利分布又稱為兩點(diǎn)分布, 需要引入伯努利實(shí)驗(yàn).
伯努利試驗(yàn)是只有兩種結(jié)果的單次隨機(jī)試驗(yàn),
進(jìn)行一次伯努利試驗(yàn), 成功(X=1)概率為p(0<=p<=1), 失敗(X=0)的概率1-p, 則稱隨機(jī)變量X服從伯努利分布
泊松分布
泊松概率分布是在連續(xù)時(shí)間或空間單位上發(fā)生隨機(jī)事件次數(shù)的概率。通俗解釋就是基于過去某個(gè)隨機(jī)事件在某段時(shí)間或某個(gè)空間內(nèi)發(fā)生的平均次數(shù)盹沈,預(yù)測(cè)該隨機(jī)事件在未來(lái)同樣長(zhǎng)的時(shí)間或同樣大的空間內(nèi)發(fā)生n次的概率龄章。
應(yīng)用:經(jīng)常被用于銷售較低的商品庫(kù)存控制,特別是價(jià)格昂貴乞封、需求量不大的商品
連續(xù)性變量概率分布
指數(shù)分布:
指數(shù)分布描述的事兩次隨機(jī)事件發(fā)生的時(shí)間間隔的概率分布情況做裙,這里的時(shí)間間隔指的是一次隨機(jī)事件發(fā)生到下一次隨機(jī)事件再發(fā)生的時(shí)間間隔。
指數(shù)分布與泊松分布正好互補(bǔ)
均勻分布
均勻概率分布是古典概率分布的連續(xù)形式肃晚,是指隨機(jī)事件的可能結(jié)果是連續(xù)型數(shù)據(jù)變量锚贱,所有的連續(xù)型數(shù)據(jù)結(jié)果所對(duì)應(yīng)的概率相等。
概率密度函數(shù)如下:
則稱X在區(qū)間(a关串,b)上服從均勻分布. 記為X~U(a拧廊,b)
正態(tài)分布
正態(tài)概率分布是所有概率分布中最重要的形式,它能夠表示被測(cè)事物處于穩(wěn)定狀態(tài)的原因晋修。正態(tài)分布曲線酷似古代的大鐘吧碾,曲線被穿過均值的垂線分成完全相等的兩半。
曲線的總面積為1墓卦,代表100%的概率倦春,其中50%位于均值垂線的左側(cè),另外50%位于均值垂線的右側(cè)落剪。
普通的正態(tài)分布概率密度公式:
當(dāng)出現(xiàn)均值=0, 標(biāo)準(zhǔn)差=1, 標(biāo)準(zhǔn)正態(tài)分布時(shí):
正態(tài)分布中還具有特殊的性質(zhì):經(jīng)驗(yàn)法則(6西格瑪法則)
68.3% 的數(shù)據(jù)會(huì)分布在均值± 1個(gè)標(biāo)準(zhǔn)差范圍內(nèi);
95.4% 的數(shù)據(jù)會(huì)分布在均值± 2個(gè)標(biāo)準(zhǔn)差范圍內(nèi);
99.7% 的數(shù)據(jù)會(huì)分布在均值± 3 個(gè)標(biāo)準(zhǔn)差范圍內(nèi).
卡方分布
卡方分布是概率統(tǒng)計(jì)里常用的一種概率分布睁本,也是統(tǒng)計(jì)推斷里應(yīng)用最廣泛的概率分布之一,在假設(shè)檢驗(yàn)與置信區(qū)間的計(jì)算中經(jīng)常能見到卡方分布的身影忠怖。
卡方分布能用于從樣本方差到總體方差的推斷性分析呢堰,甚至還能用于非參數(shù)檢驗(yàn),被稱為卡方檢驗(yàn)
beta分布
貝塔分布(Beta Distribution) 是一個(gè)作為伯努利分布和二項(xiàng)式分布的共軛先驗(yàn)分布的密度函數(shù)脑又,在機(jī)器學(xué)習(xí)和數(shù)理統(tǒng)計(jì)學(xué)中有重要應(yīng)用暮胧。在概率論中,貝塔分布问麸,也稱Β分布往衷,是指一組定義在(0,1) 區(qū)間的連續(xù)概率分布。