摘要:隨機(jī)事件岁钓、隨機(jī)變量の學(xué)習(xí)筆記
涉及概念:隨機(jī)事件升略,概率,古典概型屡限,條件概率品嚣,全概率公式,貝葉斯公式钧大,隨機(jī)變量翰撑,伯努利實(shí)驗(yàn),二項(xiàng)分布啊央,數(shù)學(xué)期望眶诈,方差,協(xié)方差瓜饥,相關(guān)系數(shù)
預(yù)警:筆記很長J徘恕(然鵝只是知識海洋中滄海一粟)
???此文包含一堆文字定義和公式 (一遍讀不順就多讀幾遍??)
一、隨機(jī)事件
?1. 基本概念
???i. 隨機(jī)現(xiàn)象:一件事情在某條件下的結(jié)果不能預(yù)先完全確定压固,只能確定
?????????是多種可能結(jié)果中的一種球拦。
????????(例如:拋一枚硬幣是一個(gè)隨機(jī)現(xiàn)象 – 因?yàn)榻Y(jié)果可能是正面靠闭,
?????????也可能是反面)
???ii. 隨機(jī)試驗(yàn)():隨機(jī)現(xiàn)象的實(shí)現(xiàn)和對它觀察的全過程帐我。
??????????????滿足條件:
??????????????1. 可以在相同條件下重復(fù)進(jìn)行
??????????????2. 結(jié)果有多種可能性且所有可能結(jié)果事先已知
??????????????3.做一次試驗(yàn)究竟哪個(gè)結(jié)果出現(xiàn)事先不能確定
???iii. 樣本空間():隨機(jī)試驗(yàn)的所有可能結(jié)果組成的集合。
???iv. 樣本點(diǎn)():[讀作omega] ?隨機(jī)試驗(yàn)的每一個(gè)可能的結(jié)果愧膀。
???v. 隨機(jī)事件(….):樣本空間中滿足一定條件的子集拦键。
??????????????????隨機(jī)事件可能出現(xiàn)也可能不出現(xiàn)。
???vi. 必然事件:每次試驗(yàn)中總是發(fā)生的事件檩淋。
?????????(比如樣本空間()為必然事件芬为,因?yàn)槠浒怂?br>??????????樣本點(diǎn),構(gòu)成該事件的一個(gè)樣本點(diǎn)必然會出現(xiàn))
???vii. 不可能事件:每次試驗(yàn)中總不發(fā)生的事件蟀悦。
??????????(比如空集()為不可能事件媚朦,因?yàn)椴话魏螛颖军c(diǎn))
?????舉個(gè)栗子:
??????扔一枚六面的骰子:
??????隨機(jī)現(xiàn)象:扔一枚骰子,可能出現(xiàn)中任意一個(gè)數(shù)字
??????隨機(jī)試驗(yàn):扔一枚骰子日戈,觀察出現(xiàn)的點(diǎn)數(shù)
??????樣本空間:={
}
??????樣本點(diǎn):出現(xiàn)的每一個(gè)數(shù)字都是一個(gè)樣本點(diǎn)
??????隨機(jī)事件:比如出現(xiàn)的數(shù)字為偶數(shù)就是一個(gè)隨機(jī)事件询张,
???????????記為={
},
為
的一個(gè)子集
??????必然事件:={
}
??????不可能事件: (比如結(jié)果為大于6的數(shù)字)
?2. 概率
???i. 定義:
?????隨機(jī)試驗(yàn), 樣本空間為
浙炼,對于每個(gè)事件
賦予一個(gè)實(shí)數(shù)
份氧,
?????稱為事件的概率唯袄。函數(shù)
滿足條件:
????????1. 非負(fù)性:每一個(gè)事件,
????????2. 規(guī)范性:
????????3. 可列可加性:若事件兩兩互斥蜗帜,
???????????????即
?????????????則
???ii. 主要性質(zhì):
?????1. 任一事件厅缺,均有
?????2. 兩個(gè)事件和
蔬顾,若
,
??????則有
?????3. 任意兩個(gè)事件和
阎抒,
???????有
?????舉栗:
??????投骰子,假設(shè) = {
},
= {
}
??????因?yàn)?img class="math-inline" src="https://math.jianshu.com/math?formula=1%2C2%2C3%2C4%2C5%2C6" alt="1,2,3,4,5,6" mathimg="1">出現(xiàn)的概率均為消痛,所以:
??????
??????
??????
??????
??????
??? ???[此處 ]
?3. 古典概型(等可能概型 / classical probability)
???i. 定義:
?????隨機(jī)事件的樣本空間有有限個(gè)樣本點(diǎn)且叁,每個(gè)樣本點(diǎn)出現(xiàn)是等可能的,
??? ??每次試驗(yàn)有且僅有一個(gè)樣本點(diǎn)發(fā)生秩伞,稱為古典概型逞带。
??? ??其中
?????兩個(gè)小栗子:
????1. 假設(shè)有 個(gè)不同顏色的球,每個(gè)球以同樣的概率
落到
個(gè)格子
??? ?? 的每個(gè)中纱新,且每個(gè)格子可容納任意多個(gè)球展氓。
??? ??求事件 和
的概率。
??? ??指定的
個(gè)格子中各有一個(gè)球脸爱。
??? ??存在
個(gè)格子遇汞,其中各有一個(gè)球。
???????解題思路:
?????基本事件總數(shù):每一個(gè)球都可能扔到個(gè)格子中的一個(gè)簿废,一共
個(gè)球空入,
??? ??? ? ? ? ? ? 共種情況
?????事件:
個(gè)格子各一個(gè)球,相當(dāng)于
個(gè)球排列,情況有
種
?????????
?????事件:在每個(gè)事件
基礎(chǔ)上族檬,從
格子里選
個(gè)格子有
種組合
?????????
????2.生日問題: k個(gè)同班同學(xué)沒有生日相同的概率
??????(思路轉(zhuǎn)換:想象每個(gè)人是個(gè)球单料,被扔到時(shí)間的格子里埋凯,一年365天,
?????所以=365扫尖,此事件類似栗子1中的事件
)
?????所以假設(shè)白对,
?????
?????生日相同的概率 =
?????[ 學(xué)好概率就不會在遇到同一天生日的人的時(shí)候大驚小怪了 hh ]
'''Python 代碼實(shí)現(xiàn)栗子2中的 P(B) 的計(jì)算'''
# 函數(shù)遞歸實(shí)現(xiàn)階乘
def factorial(n):
if n == 0:
return 1
else:
return (n * factorial (n-1))
l_fact = factorial(365)
l_k_fact = factorial(365-40)
l_k_exp = 365 ** 40
P_B = l_fact / (l_k_fact * l_k_exp)
print("事件B的概率為:", P_B )
?4. 條件概率(Conditional Probability)
???i. 定義:
??????和
兩個(gè)事件,且
, 在事件
發(fā)生的條件下,事件
??????發(fā)生的概率為:
?????栗子:
??????個(gè)男性换怖,
個(gè)女性甩恼,其中男色盲患者
人,女色盲患者
人。
??????表示全體女性集合媳拴,
表示全體色盲集合:則
??????
??????
??????
?????? (在女性中隨機(jī)抽一個(gè)人為色盲的概率)
?5. 全概率公式(Law of Total Probability)
????由條件概率公式可得:
????設(shè)是樣本空間
的一個(gè)劃分黄橘,
為任一事件,則
? ??????全概率公式:
?6. 貝葉斯公式(Bayes’ Theorem)
????設(shè)是樣本空間
的一個(gè)劃分屈溉,則對任一事件
???? ,有
????
????其中 為先驗(yàn)概率塞关,
??????為后驗(yàn)概率
?????貝葉斯公式示例
???假定用血清甲胎蛋白法診斷肝癌。用 表示被檢驗(yàn)者有肝癌這一事件子巾,
???用 表示被檢驗(yàn)者為陽性反應(yīng)這一事件帆赢。當(dāng)前有肝癌的患者被檢測呈陽性
???反應(yīng)的概率為0.95。即 线梗。當(dāng)前非肝癌的患者被檢測呈陰
???性反應(yīng)的概率為0.9椰于。即 。若某人群中肝癌患者概率為
???0.0004仪搔,即瘾婿,現(xiàn)在有一人呈陽性反應(yīng),求此人確為肝癌
???患者的概率是多少烤咧?
?????解題思路:
二偏陪、隨機(jī)變量
?1. 隨機(jī)變量及其分布
???i. 定義:
??????為隨機(jī)試驗(yàn),樣本空間為
煮嫌,對于每一個(gè)
笛谦,都有一個(gè)
??????確定的實(shí)數(shù)與之對應(yīng),若對于任意實(shí)
,
??????有 昌阿,則稱
上的單值實(shí)函數(shù)
??????為一個(gè)隨機(jī)變量饥脑。
???ii. 定義理解:
??????隨機(jī)變量取值在實(shí)數(shù)域上的函數(shù),自變量是隨機(jī)試驗(yàn)的結(jié)果懦冰,結(jié)果
??????出現(xiàn)具有隨機(jī)性灶轰,所以隨機(jī)變量取值也具有隨機(jī)性,區(qū)別于普通函數(shù)
???iii. 分布函數(shù)(概率累積函數(shù))定義:
??????
??????在
處取值為隨機(jī)變量
落在區(qū)間
上的概率
?2. 離散型隨機(jī)變量(
的全部取值為有限多個(gè)或可列無窮多個(gè))
??????
??????
?3. 常見離散型分布
???i. 伯努利實(shí)驗(yàn) (Bernoulli trail)
?????定義:隨機(jī)試驗(yàn)只有兩種可能的結(jié)果和
(實(shí)現(xiàn)目標(biāo)和未實(shí)現(xiàn)目標(biāo))
????????
???ii. 二項(xiàng)分布 (binomial distribution)
?????次獨(dú)立的伯努利試驗(yàn)的結(jié)果服從二項(xiàng)分布:
~
?????其中
?????分布律為:
?????分布函數(shù)為:
?????其中框往, 表示下取整鳄抒,即不超過
的最大整數(shù)闯捎。
?4. 隨機(jī)變量的數(shù)字特征
???i. 數(shù)學(xué)期望 (Expectation), 代表隨機(jī)變量取值的平均值
?????通常情況下對離散型隨機(jī)變量,
?????分布律為,若
收斂贤重,
?????
???ii. 數(shù)學(xué)期望的一些性質(zhì):
?????1. 若為常數(shù)茬祷,
?????2. ,
、
為任意常數(shù)
?????3. 若,
相互獨(dú)立不互相影響并蝗,則
???iii. 方差(Variance)祭犯,描述隨機(jī)變量取值相對于均值的離散程度
?????為隨機(jī)變量秸妥,如果
存在,則記為
的方差:
?????
????? 為
的標(biāo)準(zhǔn)差或均方差
???iv. 方差的性質(zhì):
?????1. 若為常數(shù)沃粗,
?????2. 粥惧,
、
為任意常數(shù)
?????3. 若,
相互獨(dú)立最盅,
??????則 [離散程度增加]
?5. 二維隨機(jī)變量
,
的關(guān)系
???i. 協(xié)方差 (Covariance):
????通俗理解:參考 知乎問答 兩個(gè)變量在變化過程中是同方向還是反方向突雪?
?????????同向或反向程度如何?
????
???ii. 協(xié)方差性質(zhì):
?????1.
?????2.
?????? 為任意常數(shù)
?????3.
?????4.
??????當(dāng) 相互獨(dú)立時(shí)侨核,有
?????5.
?????6.
???iii. 相關(guān)系數(shù)(correlation coefficient):
?????用來衡量兩個(gè)變量之間的相關(guān)程度铣耘,一種剔除了兩個(gè)變量量綱影響蛛蒙、
?????標(biāo)準(zhǔn)化后的特殊協(xié)方差 (參考 知乎問答)
?????當(dāng)時(shí)慢宗,
?????相關(guān)性系數(shù)
???iv. 相關(guān)系數(shù)解讀:
?????1. 沒有單位练链,只是一個(gè)代數(shù)值
?????2. 取值范圍,小于
表示負(fù)相關(guān)沃但,大于
表示正相關(guān)可款,
??????絕對值越接近表示相關(guān)度越大
Credit:
筆記整理自:Datawhale 概率統(tǒng)計(jì)組隊(duì)學(xué)習(xí)