概率統(tǒng)計(jì)組隊(duì)學(xué)習(xí) 之 隨機(jī)事件與隨機(jī)變量

摘要:隨機(jī)事件岁钓、隨機(jī)變量の學(xué)習(xí)筆記

涉及概念:隨機(jī)事件升略,概率,古典概型屡限,條件概率品嚣,全概率公式,貝葉斯公式钧大,隨機(jī)變量翰撑,伯努利實(shí)驗(yàn),二項(xiàng)分布啊央,數(shù)學(xué)期望眶诈,方差,協(xié)方差瓜饥,相關(guān)系數(shù)
預(yù)警:筆記很長J徘恕(然鵝只是知識海洋中滄海一粟)
???此文包含一堆文字定義和公式 (一遍讀不順就多讀幾遍??)

一、隨機(jī)事件

?1. 基本概念

???i. 隨機(jī)現(xiàn)象:一件事情在某條件下的結(jié)果不能預(yù)先完全確定压固,只能確定
?????????是多種可能結(jié)果中的一種球拦。
????????(例如:拋一枚硬幣是一個(gè)隨機(jī)現(xiàn)象 – 因?yàn)榻Y(jié)果可能是正面靠闭,
?????????也可能是反面)

???ii. 隨機(jī)試驗(yàn)(E):隨機(jī)現(xiàn)象的實(shí)現(xiàn)和對它觀察的全過程帐我。
??????????????滿足條件
??????????????1. 可以在相同條件下重復(fù)進(jìn)行
??????????????2. 結(jié)果有多種可能性且所有可能結(jié)果事先已知
??????????????3.做一次試驗(yàn)究竟哪個(gè)結(jié)果出現(xiàn)事先不能確定
???iii. 樣本空間(\Omega):隨機(jī)試驗(yàn)的所有可能結(jié)果組成的集合。
???iv. 樣本點(diǎn)(\omega):[讀作omega] ?隨機(jī)試驗(yàn)的每一個(gè)可能的結(jié)果愧膀。
???v. 隨機(jī)事件(A, B, C….):樣本空間中滿足一定條件的子集拦键。
??????????????????隨機(jī)事件可能出現(xiàn)也可能不出現(xiàn)。
???vi. 必然事件:每次試驗(yàn)中總是發(fā)生的事件檩淋。
?????????(比如樣本空間(\Omega)為必然事件芬为,因?yàn)槠浒怂?br>??????????樣本點(diǎn),構(gòu)成該事件的一個(gè)樣本點(diǎn)必然會出現(xiàn))
???vii. 不可能事件:每次試驗(yàn)中總不發(fā)生的事件蟀悦。
??????????(比如空集(\phi)為不可能事件媚朦,因?yàn)椴话魏螛颖军c(diǎn))
?????舉個(gè)栗子
??????扔一枚六面的骰子:
??????隨機(jī)現(xiàn)象:扔一枚骰子,可能出現(xiàn)1,2,3,4,5,6中任意一個(gè)數(shù)字
??????隨機(jī)試驗(yàn):扔一枚骰子日戈,觀察出現(xiàn)的點(diǎn)數(shù)
??????樣本空間:\Omega={1,2,3,4,5,6}
??????樣本點(diǎn):出現(xiàn)的每一個(gè)數(shù)字都是一個(gè)樣本點(diǎn)
??????隨機(jī)事件:比如出現(xiàn)的數(shù)字為偶數(shù)就是一個(gè)隨機(jī)事件询张,
???????????記為A={2,4,6},A\Omega的一個(gè)子集
??????必然事件:\Omega={1,2,3,4,5,6}
??????不可能事件:\phi (比如結(jié)果為大于6的數(shù)字)

?2. 概率

???i. 定義:
?????隨機(jī)試驗(yàn)E, 樣本空間為\Omega浙炼,對于每個(gè)事件A賦予一個(gè)實(shí)數(shù)P(A)份氧,
?????稱為事件A的概率唯袄。函數(shù)P(.)滿足條件:
????????1. 非負(fù)性:每一個(gè)事件A0 < P(A) <= 1
????????2. 規(guī)范性:P(\Omega) = 1
????????3. 可列可加性:若事件A_1, A_2,…兩兩互斥蜗帜,
???????????????即i恋拷,j=1,2,...,i \neq j ,A_i \cap A_j = \phi
?????????????則P(A_1 \cup A_2 \cup ...)=P(A_1) +P(A_2) +...

???ii. 主要性質(zhì):
?????1. 任一事件A厅缺,均有P(\overline{A})=1-P(A)
?????2. 兩個(gè)事件AB蔬顾,若A \subset B
??????則有P(B) >P(A)湘捎, P(B-A) = P(B) - P(A)
?????3. 任意兩個(gè)事件AB阎抒,
???????有P(A \cup B) = P(A) + P(B) - P(A\cap B)
?????舉栗:
??????投骰子,假設(shè)A = {1,2}, B = {1,2,3}
??????因?yàn)?img class="math-inline" src="https://math.jianshu.com/math?formula=1%2C2%2C3%2C4%2C5%2C6" alt="1,2,3,4,5,6" mathimg="1">出現(xiàn)的概率均為1/6消痛,所以:
??????P(A)=1/3
??????P(B)=1/2
??????P(\overline{A})=1-1/3 = 2/3
??????P(B-A)=1/2-1/3=1/6
??????P(A∪B)=1/3+1/2-1/3=1/2
??? ???[此處 P(A∩B)=P(A)=1/3]

?3. 古典概型(等可能概型 / classical probability)

???i. 定義:
?????隨機(jī)事件E的樣本空間有有限個(gè)樣本點(diǎn)且叁,每個(gè)樣本點(diǎn)出現(xiàn)是等可能的,
??? ??每次試驗(yàn)有且僅有一個(gè)樣本點(diǎn)發(fā)生秩伞,稱為古典概型逞带。
??? ??其中P(A) = \frac{m} {n} = \frac{事件A包含的基本事件數(shù)} {基本事件總數(shù)}
?????兩個(gè)小栗子:
????1. 假設(shè)有 k 個(gè)不同顏色的球,每個(gè)球以同樣的概率 1/l 落到 l 個(gè)格子
??? ??(l>=k) 的每個(gè)中纱新,且每個(gè)格子可容納任意多個(gè)球展氓。
??? ??求事件 AB 的概率。
??? ??A:指定的 k 個(gè)格子中各有一個(gè)球脸爱。
??? ??B:存在 k 個(gè)格子遇汞,其中各有一個(gè)球。
???????解題思路:
?????基本事件總數(shù):每一個(gè)球都可能扔到l個(gè)格子中的一個(gè)簿废,一共k個(gè)球空入,
??? ??? ? ? ? ? ? 共l^k種情況
?????事件Ak個(gè)格子各一個(gè)球,相當(dāng)于k個(gè)球排列,情況有k!
?????????P(A) = \frac{k!} {l^k}
?????事件B:在每個(gè)事件A基礎(chǔ)上族檬,從l格子里選k個(gè)格子有 C^k_l 種組合
?????????P(B) = \frac {C^k_lk歪赢!} {l^k} = \frac {l!} {l^k(l-k)!}

????2.生日問題: k個(gè)同班同學(xué)沒有生日相同的概率
??????(思路轉(zhuǎn)換:想象每個(gè)人是個(gè)球单料,被扔到時(shí)間的格子里埋凯,一年365天,
?????所以l=365扫尖,此事件類似栗子1中的事件B
?????所以假設(shè)k=40白对,
?????P(B)=\frac{365!}{365^{40} * (365-40)!}= 0.109
?????生日相同的概率 P(\overline{B}) = 1-0.109=0.891
?????[ 學(xué)好概率就不會在遇到同一天生日的人的時(shí)候大驚小怪了 hh ]

         '''Python 代碼實(shí)現(xiàn)栗子2中的 P(B) 的計(jì)算'''
         # 函數(shù)遞歸實(shí)現(xiàn)階乘 
         def factorial(n): 
           if n == 0:
               return 1
           else:
               return (n * factorial (n-1)) 

         l_fact = factorial(365)
         l_k_fact = factorial(365-40)
         l_k_exp = 365 ** 40

         P_B = l_fact / (l_k_fact * l_k_exp)
         print("事件B的概率為:", P_B ) 
?4. 條件概率(Conditional Probability)

???i. 定義:
??????AB兩個(gè)事件,且P(B)>0, 在事件B發(fā)生的條件下,事件A
??????發(fā)生的概率為:P(A|B) = \frac{P(AB)}{P(B)}
?????栗子:
??????N個(gè)男性换怖,M個(gè)女性甩恼,其中男色盲患者n人,女色盲患者m人。
??????A表示全體女性集合媳拴,B表示全體色盲集合:則
??????P(A) = \frac{M}{M+N}
??????P(B) = \frac{m+n}{M+N}
??????P(AB) = \frac{m}{M+N}
??????P(B|A) = \frac{\frac{m}{M+N}}{\frac{M}{M+N}} = \frac{m}{M} (在女性中隨機(jī)抽一個(gè)人為色盲的概率)

?5. 全概率公式(Law of Total Probability)

????由條件概率公式可得: P(AB)=P(B|A)P(A) =P(A|B)P(B)
????設(shè)B_1,B_2,...是樣本空間 \Omega 的一個(gè)劃分黄橘,A 為任一事件,則
? ??????全概率公式:P(A) = \sum_{i=1}^{\infty } {P(B_i)}P(A|B_i)

?6. 貝葉斯公式(Bayes’ Theorem)

????設(shè)B_1,B_2,...是樣本空間 \Omega 的一個(gè)劃分屈溉,則對任一事件
???? A(P(A)>0) ,有
????P(B_i|A) =\frac {P(B_i A)} {P(A)} = \frac {P(A|B_i )P(B_i)} {\sum_{j=1}^{\infty }P( B_j)P(A|B_j)} ,i=1,2,...
????其中P(B_i)(i=1,2,...) 為先驗(yàn)概率塞关,
??????P(B_i|A)(i=1,2,...)為后驗(yàn)概率
?????貝葉斯公式示例
???假定用血清甲胎蛋白法診斷肝癌。用 C 表示被檢驗(yàn)者有肝癌這一事件子巾,
???用 A 表示被檢驗(yàn)者為陽性反應(yīng)這一事件帆赢。當(dāng)前有肝癌的患者被檢測呈陽性
???反應(yīng)的概率為0.95。即 P(A|C) = 0.95 线梗。當(dāng)前非肝癌的患者被檢測呈陰
???性反應(yīng)的概率為0.9椰于。即 P(\overline {A}|\overline {C}) = 0.90 。若某人群中肝癌患者概率為
???0.0004仪搔,即P(C) = 0.0004瘾婿,現(xiàn)在有一人呈陽性反應(yīng),求此人確為肝癌
???患者的概率是多少烤咧?
?????解題思路:

畫個(gè)圖也許更清晰.jpg

P(C|A) = \frac {P(C)P(A|C)} {P(C)P(A|C)+P(\overline {C} )P(A|\overline {C})} =\frac {0.00040.95}{0.00040.95 + 0.9996*0.1} =0.0038


二偏陪、隨機(jī)變量

?1. 隨機(jī)變量及其分布

???i. 定義:
??????E為隨機(jī)試驗(yàn),樣本空間為\Omega煮嫌,對于每一個(gè) \omega \in \Omega笛谦,都有一個(gè)
??????確定的實(shí)數(shù)X(\omega)與之對應(yīng),若對于任意實(shí) x \in R ,
??????有 {\omega :X(\omega) < x } \in F 昌阿,則稱 \Omega 上的單值實(shí)函數(shù) X(\omega)
??????為一個(gè)隨機(jī)變量饥脑。
???ii. 定義理解:
??????隨機(jī)變量取值在實(shí)數(shù)域上的函數(shù),自變量是隨機(jī)試驗(yàn)的結(jié)果懦冰,結(jié)果
??????出現(xiàn)具有隨機(jī)性灶轰,所以隨機(jī)變量取值也具有隨機(jī)性,區(qū)別于普通函數(shù)

???iii. 分布函數(shù)(概率累積函數(shù))定義:
??????F(x) = P { (X<=x)} , x \in (- \infty ,+ \infty)
??????F(x)x處取值為隨機(jī)變量X落在區(qū)間(- \infty, + x]上的概率

?2. 離散型隨機(jī)變量(X的全部取值為有限多個(gè)或可列無窮多個(gè))

??????P { (X =x_k) } =p_k,k=1,2,...
??????F (x) = P { (X<=x) } =\sum_{x_k <=x}{ P { (X=x_k) } } = \sum_{x_k <=x}{ P_k}

?3. 常見離散型分布

???i. 伯努利實(shí)驗(yàn) (Bernoulli trail)
?????定義:隨機(jī)試驗(yàn)只有兩種可能的結(jié)果A\overline A (實(shí)現(xiàn)目標(biāo)和未實(shí)現(xiàn)目標(biāo))
????????P(A) = p儿奶,P(\overline A) =1-p=q
???ii. 二項(xiàng)分布 (binomial distribution)
?????n次獨(dú)立的伯努利試驗(yàn)的結(jié)果服從二項(xiàng)分布: X ~ B(n, p)
?????其中P(A_k) =C^k_np^k(1-p)^{n-k},k=0,1,2,...n.
?????分布律為:P { (X=k) } =C^k_np^k(1-p)^{n-k},k=0,1,2,...n.
?????分布函數(shù)為: F(x) = \sum_{k=}^{[x]} {C^k_np^k(1-p)^{n-k}},k=0,1,2,...n.
?????其中框往, [x] 表示下取整鳄抒,即不超過 x 的最大整數(shù)闯捎。

?4. 隨機(jī)變量的數(shù)字特征

???i. 數(shù)學(xué)期望 (Expectation), 代表隨機(jī)變量取值的平均值
?????通常情況下對離散型隨機(jī)變量X
?????分布律為P { X=x_i} = p_i ,i =1许溅,2瓤鼻,...,若\sum_{i} {|x_i|p_i} 收斂贤重,
?????E(X) = \sum_{i} {x_ip_i}
???ii. 數(shù)學(xué)期望的一些性質(zhì):
?????1. 若c為常數(shù)茬祷,E(c)=c
?????2. E(aX+bY) = aE(X)+bE(Y), ab為任意常數(shù)
?????3. 若X,Y相互獨(dú)立不互相影響并蝗,則E(XY)=E(X)E(Y)

???iii. 方差(Variance)祭犯,描述隨機(jī)變量取值相對于均值的離散程度
?????X為隨機(jī)變量秸妥,如果E{[X-E(X)]^2}存在,則記為X的方差:
?????Var(X) = E{[X-E(X)]^2} = \sum_{i} (i-E(X))^2P(X=i)
?????\sqrt{Var(X)}X的標(biāo)準(zhǔn)差或均方差
???iv. 方差的性質(zhì):
?????1. 若c為常數(shù)沃粗,Var(c)=0
?????2. Var(aX+b) = a^2Var(X)粥惧,ab為任意常數(shù)
?????3. 若X,Y相互獨(dú)立最盅,
??????則Var(X+Y) = Var(X) + Var(Y) [離散程度增加]

?5. 二維隨機(jī)變量X, Y的關(guān)系

???i. 協(xié)方差 (Covariance):
????通俗理解:參考 知乎問答 兩個(gè)變量在變化過程中是同方向還是反方向突雪?
?????????同向或反向程度如何?
????Cov(X, Y) = E{ [X-E(X)] [Y-E(Y)]}
???ii. 協(xié)方差性質(zhì):
?????1. Cov(X, Y) = Cov(Y, X)
?????2. Cov(aX+b涡贱,cY+d) =ac Cov( X咏删,Y)
??????a,b,c,d 為任意常數(shù)
?????3.Cov(X_1+X_2,Y) =Cov( X_1问词,Y) +Cov( X_2督函,Y)
?????4. Cov(X,Y) =E( X激挪,Y) -E( X)E(Y)
??????當(dāng) X,Y 相互獨(dú)立時(shí)侨核,有 Cov(X,Y) = 0
?????5. |Cov(X灌灾,Y)| <= \sqrt {Var(X)} \sqrt {Var(Y)}
?????6. Cov(X搓译,X) =Var( X)

???iii. 相關(guān)系數(shù)(correlation coefficient):
?????用來衡量兩個(gè)變量之間的相關(guān)程度铣耘,一種剔除了兩個(gè)變量量綱影響蛛蒙、
?????標(biāo)準(zhǔn)化后的特殊協(xié)方差 (參考 知乎問答
?????當(dāng)\sqrt {Var(X)} >0 蜓竹,\sqrt {Var(Y)} >0時(shí)慢宗,
?????相關(guān)性系數(shù)\rho(X,Y) = \frac{Cov(X悄晃,Y)}{\sqrt {Var(X)} \sqrt {Var(Y)}}
???iv. 相關(guān)系數(shù)解讀:
?????1. 沒有單位练链,只是一個(gè)代數(shù)值
?????2. 取值范圍[-1,1],小于0表示負(fù)相關(guān)沃但,大于0表示正相關(guān)可款,
??????絕對值越接近1表示相關(guān)度越大

Credit:
筆記整理自:Datawhale 概率統(tǒng)計(jì)組隊(duì)學(xué)習(xí)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末炉奴,一起剝皮案震驚了整個(gè)濱河市逼庞,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌瞻赶,老刑警劉巖赛糟,帶你破解...
    沈念sama閱讀 218,525評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異砸逊,居然都是意外死亡璧南,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,203評論 3 395
  • 文/潘曉璐 我一進(jìn)店門师逸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來司倚,“玉大人,你說我怎么就攤上這事《” “怎么了皿伺?”我有些...
    開封第一講書人閱讀 164,862評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長盒粮。 經(jīng)常有香客問我心傀,道長,這世上最難降的妖魔是什么拆讯? 我笑而不...
    開封第一講書人閱讀 58,728評論 1 294
  • 正文 為了忘掉前任脂男,我火速辦了婚禮,結(jié)果婚禮上种呐,老公的妹妹穿的比我還像新娘宰翅。我一直安慰自己,他們只是感情好爽室,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,743評論 6 392
  • 文/花漫 我一把揭開白布汁讼。 她就那樣靜靜地躺著,像睡著了一般阔墩。 火紅的嫁衣襯著肌膚如雪嘿架。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,590評論 1 305
  • 那天啸箫,我揣著相機(jī)與錄音耸彪,去河邊找鬼。 笑死忘苛,一個(gè)胖子當(dāng)著我的面吹牛蝉娜,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播扎唾,決...
    沈念sama閱讀 40,330評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼召川,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了胸遇?” 一聲冷哼從身側(cè)響起荧呐,我...
    開封第一講書人閱讀 39,244評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎纸镊,沒想到半個(gè)月后倍阐,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,693評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡薄腻,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,885評論 3 336
  • 正文 我和宋清朗相戀三年收捣,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片庵楷。...
    茶點(diǎn)故事閱讀 40,001評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出尽纽,到底是詐尸還是另有隱情咐蚯,我是刑警寧澤,帶...
    沈念sama閱讀 35,723評論 5 346
  • 正文 年R本政府宣布弄贿,位于F島的核電站春锋,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏差凹。R本人自食惡果不足惜期奔,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,343評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望危尿。 院中可真熱鬧呐萌,春花似錦、人聲如沸谊娇。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,919評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽济欢。三九已至赠堵,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間法褥,已是汗流浹背茫叭。 一陣腳步聲響...
    開封第一講書人閱讀 33,042評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留半等,地道東北人杂靶。 一個(gè)月前我還...
    沈念sama閱讀 48,191評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像酱鸭,于是被迫代替她去往敵國和親吗垮。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,955評論 2 355