第三周:統(tǒng)計(jì)學(xué)之幾種常見的數(shù)據(jù)分布

【理論】概率分布

基本概念:

隨機(jī)變量剥槐;古典概率;條件概率宪摧;離散變量粒竖;連續(xù)變量颅崩;期望值

離散變量概率分布

二項(xiàng)分布;伯努利分布蕊苗;泊松分布

連續(xù)變量概率分布

均勻分布沿后;正態(tài)分布;指數(shù)分布朽砰;伽瑪分布尖滚;偏態(tài)分布;貝塔分布瞧柔;威布爾分布漆弄;卡方分布;F分布

一非剃、基本概念

隨機(jī)變量:

隨機(jī)變量(random variable)表示隨機(jī)試驗(yàn)各種結(jié)果的實(shí)值單值函數(shù)置逻。簡(jiǎn)單地說(shuō),隨機(jī)變量是指隨機(jī)事件的數(shù)量表現(xiàn)备绽。例如一批注入某種毒物的動(dòng)物券坞,在一定時(shí)間內(nèi)死亡的只數(shù);某地若干名男性健康成人中肺素,每人血紅蛋白量的測(cè)定值恨锚;等等。

古典概率:

古典概率通常又叫事前概率倍靡,是指當(dāng)隨機(jī)事件中各種可能發(fā)生的結(jié)果及其出現(xiàn)的次數(shù)都可以由演繹或外推法得知猴伶,而無(wú)需經(jīng)過任何統(tǒng)計(jì)試驗(yàn)即可計(jì)算各種可能發(fā)生結(jié)果的概率。

因?yàn)楣诺涫录慕Y(jié)果數(shù)目已知塌西,且每種結(jié)果對(duì)應(yīng)的發(fā)生概率相等他挎。例如扔骰子,不管如何扔捡需,出現(xiàn)某個(gè)點(diǎn)數(shù)的概率等于1/6

條件概率:

條件概率是指事件A在事件B發(fā)生的條件下發(fā)生的概率办桨。條件概率表示為:P(A|B),讀作“A在B發(fā)生的條件下發(fā)生的概率”站辉。若只有兩個(gè)事件A呢撞,B,那么
image.png

變量

離散變量

連續(xù)變量

期望值

期望值是隨機(jī)試驗(yàn)在同樣的機(jī)會(huì)下重復(fù)多次的結(jié)果計(jì)算出的等同“期望”的平均值饰剥。

二殊霞、離散變量概率分布

二項(xiàng)分布

二項(xiàng)分布是由伯努利提出的概念,指的是重復(fù)n次獨(dú)立的伯努利試驗(yàn)汰蓉,發(fā)生的結(jié)果只有兩個(gè)绷蹲。

特點(diǎn):

1.每次試驗(yàn)只有兩種可能得結(jié)果:“成功”與“失敗”,兩個(gè)結(jié)果只會(huì)出現(xiàn)一個(gè)古沥;

2.每次試驗(yàn)前瘸右,如果“成功”的概率是p娇跟,那么“失敗”的概率是(1-p)岩齿;

3.每次試驗(yàn)相互獨(dú)立太颤,每次試驗(yàn)結(jié)果不受其他各次試驗(yàn)結(jié)果的影響

伯努利分布

伯努利分布是二項(xiàng)分布在n=1時(shí)的特例.

伯努利分布又稱為兩點(diǎn)分布, 需要引入伯努利實(shí)驗(yàn).

伯努利試驗(yàn)是只有兩種結(jié)果的單次隨機(jī)試驗(yàn),

進(jìn)行一次伯努利試驗(yàn), 成功(X=1)概率為p(0<=p<=1), 失敗(X=0)的概率1-p, 則稱隨機(jī)變量X服從伯努利分布

泊松分布

泊松概率分布是在連續(xù)時(shí)間或空間單位上發(fā)生隨機(jī)事件次數(shù)的概率。通俗解釋就是基于過去某個(gè)隨機(jī)事件在某段時(shí)間或某個(gè)空間內(nèi)發(fā)生的平均次數(shù)盹沈,預(yù)測(cè)該隨機(jī)事件在未來(lái)同樣長(zhǎng)的時(shí)間或同樣大的空間內(nèi)發(fā)生n次的概率龄章。

應(yīng)用:經(jīng)常被用于銷售較低的商品庫(kù)存控制,特別是價(jià)格昂貴乞封、需求量不大的商品

連續(xù)性變量概率分布

指數(shù)分布:

指數(shù)分布描述的事兩次隨機(jī)事件發(fā)生的時(shí)間間隔的概率分布情況做裙,這里的時(shí)間間隔指的是一次隨機(jī)事件發(fā)生到下一次隨機(jī)事件再發(fā)生的時(shí)間間隔。

指數(shù)分布與泊松分布正好互補(bǔ)

均勻分布

均勻概率分布是古典概率分布的連續(xù)形式肃晚,是指隨機(jī)事件的可能結(jié)果是連續(xù)型數(shù)據(jù)變量锚贱,所有的連續(xù)型數(shù)據(jù)結(jié)果所對(duì)應(yīng)的概率相等。

概率密度函數(shù)如下:

image.png

則稱X在區(qū)間(a关串,b)上服從均勻分布. 記為X~U(a拧廊,b)

正態(tài)分布

正態(tài)概率分布是所有概率分布中最重要的形式,它能夠表示被測(cè)事物處于穩(wěn)定狀態(tài)的原因晋修。正態(tài)分布曲線酷似古代的大鐘吧碾,曲線被穿過均值的垂線分成完全相等的兩半。

曲線的總面積為1墓卦,代表100%的概率倦春,其中50%位于均值垂線的左側(cè),另外50%位于均值垂線的右側(cè)落剪。

普通的正態(tài)分布概率密度公式:

image.png

當(dāng)出現(xiàn)均值=0, 標(biāo)準(zhǔn)差=1, 標(biāo)準(zhǔn)正態(tài)分布時(shí):

image.png

正態(tài)分布中還具有特殊的性質(zhì):經(jīng)驗(yàn)法則(6西格瑪法則)

68.3% 的數(shù)據(jù)會(huì)分布在均值± 1個(gè)標(biāo)準(zhǔn)差范圍內(nèi);

95.4% 的數(shù)據(jù)會(huì)分布在均值± 2個(gè)標(biāo)準(zhǔn)差范圍內(nèi);

99.7% 的數(shù)據(jù)會(huì)分布在均值± 3 個(gè)標(biāo)準(zhǔn)差范圍內(nèi).

卡方分布

卡方分布是概率統(tǒng)計(jì)里常用的一種概率分布睁本,也是統(tǒng)計(jì)推斷里應(yīng)用最廣泛的概率分布之一,在假設(shè)檢驗(yàn)與置信區(qū)間的計(jì)算中經(jīng)常能見到卡方分布的身影忠怖。

卡方分布能用于從樣本方差到總體方差的推斷性分析呢堰,甚至還能用于非參數(shù)檢驗(yàn),被稱為卡方檢驗(yàn)

beta分布

貝塔分布(Beta Distribution) 是一個(gè)作為伯努利分布和二項(xiàng)式分布的共軛先驗(yàn)分布的密度函數(shù)脑又,在機(jī)器學(xué)習(xí)和數(shù)理統(tǒng)計(jì)學(xué)中有重要應(yīng)用暮胧。在概率論中,貝塔分布问麸,也稱Β分布往衷,是指一組定義在(0,1) 區(qū)間的連續(xù)概率分布。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末严卖,一起剝皮案震驚了整個(gè)濱河市席舍,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌哮笆,老刑警劉巖来颤,帶你破解...
    沈念sama閱讀 218,546評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件汰扭,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡福铅,警方通過查閱死者的電腦和手機(jī)萝毛,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)滑黔,“玉大人笆包,你說(shuō)我怎么就攤上這事÷缘矗” “怎么了庵佣?”我有些...
    開封第一講書人閱讀 164,911評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)汛兜。 經(jīng)常有香客問我巴粪,道長(zhǎng),這世上最難降的妖魔是什么粥谬? 我笑而不...
    開封第一講書人閱讀 58,737評(píng)論 1 294
  • 正文 為了忘掉前任肛根,我火速辦了婚禮,結(jié)果婚禮上帝嗡,老公的妹妹穿的比我還像新娘晶通。我一直安慰自己,他們只是感情好哟玷,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,753評(píng)論 6 392
  • 文/花漫 我一把揭開白布狮辽。 她就那樣靜靜地躺著,像睡著了一般巢寡。 火紅的嫁衣襯著肌膚如雪喉脖。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,598評(píng)論 1 305
  • 那天抑月,我揣著相機(jī)與錄音树叽,去河邊找鬼。 笑死谦絮,一個(gè)胖子當(dāng)著我的面吹牛题诵,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播层皱,決...
    沈念sama閱讀 40,338評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼性锭,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了叫胖?” 一聲冷哼從身側(cè)響起草冈,我...
    開封第一講書人閱讀 39,249評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后怎棱,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體哩俭,經(jīng)...
    沈念sama閱讀 45,696評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,888評(píng)論 3 336
  • 正文 我和宋清朗相戀三年拳恋,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了凡资。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,013評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡诅岩,死狀恐怖讳苦,靈堂內(nèi)的尸體忽然破棺而出带膜,到底是詐尸還是另有隱情吩谦,我是刑警寧澤,帶...
    沈念sama閱讀 35,731評(píng)論 5 346
  • 正文 年R本政府宣布膝藕,位于F島的核電站式廷,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏芭挽。R本人自食惡果不足惜滑废,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,348評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望袜爪。 院中可真熱鬧蠕趁,春花似錦、人聲如沸辛馆。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,929評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)昙篙。三九已至腊状,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間苔可,已是汗流浹背缴挖。 一陣腳步聲響...
    開封第一講書人閱讀 33,048評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留焚辅,地道東北人映屋。 一個(gè)月前我還...
    沈念sama閱讀 48,203評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像同蜻,于是被迫代替她去往敵國(guó)和親棚点。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,960評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 隨機(jī)變量是根據(jù)偶然性取值的變量埃仪。我們?cè)谡劦诫S機(jī)變量時(shí)乙濒,通常是以“概率分布”的形式來(lái)描述他們。也即:隨機(jī)變量落在每一...
    小貍投資閱讀 5,365評(píng)論 1 7
  • 概率分布用以表達(dá)隨機(jī)變量取值的概率規(guī)律,根據(jù)隨機(jī)變量所屬類型的不同颁股,概率分布取不同的表現(xiàn)形式么库,主要分為離散變量概率...
    餅人閱讀 8,260評(píng)論 0 1
  • 看了幾篇統(tǒng)計(jì)學(xué)資料:恍然間不知道概率分布[二項(xiàng)分布] 與抽樣分布[t 分布] 差別。 大家知道甘有,統(tǒng)計(jì)學(xué)分為描...
    caokai001閱讀 1,241評(píng)論 0 1
  • 嗯嗯诉儒,夜幕降臨,我靜靜地躺在我那給予我幸福的床上亏掀,看著那“死神小學(xué)生”——名偵探柯南忱反。 突然,我爸門也不敲地走了進(jìn)...
    馮敏琪閱讀 201評(píng)論 0 1
  • 人在無(wú)端微笑時(shí)滤愕,不是百無(wú)聊賴温算,就是痛苦難當(dāng)〖溆埃——王小波<革命時(shí)期的愛情> 今天去拔了一顆智齒注竿,哎,拔得過程才幾分鐘...
    007媽咪閱讀 106評(píng)論 0 0