課程連結(jié):
臺灣交通大學 統(tǒng)計學(一) Statistics I 唐麗英老師
[統(tǒng)計學筆記及整理]
第三章.機率(Probability)
單元一.機率概念之介紹
第一章與第二章介紹了一些統(tǒng)計概念及統(tǒng)計量枝冀。當群體的參數(shù)不知時,必須要以樣本的統(tǒng)計量來推論群體的參數(shù)欠气,此時就必須知道群體資料分佈的情況咒钟。而群體資料分佈的情況洽瞬,乃是基於機率理論谒麦,因此粱锐,本單元介紹一些基本的機率概念與機率分佈疫衩。
定義一:實驗(Experiment)
實驗是指一個可記錄一些觀察體量測值的過程(Process)。
例 :
- 擲一個銅板一百次
- 擲一個骰子十次
- 量測某物一百次
定義二:樣本空間(Sample Space,S)
一個實驗的所有可能出現(xiàn)的結(jié)果之集合稱為樣本空間翅帜。
例 :
- 擲一個骰子一次姻檀,S={1,2,3,4,5,6}
- 擲一個銅板兩次,S= {(++),(+-),(-+),(--)}
- 52張撲克牌抽一張
定義三:事件(Event)
實驗的結(jié)果稱為事件涝滴,在機率論中绣版,隨機事件(或簡稱事件)指的是一個被賦與機率的事物集合,也就是樣本空間中的子集歼疮,當這個事件僅僅包括樣本空間的一個元素(或者說它是一個單元素集合)的時候杂抽,稱這個事件為一個基本事件。
例:
1)事件A={骰到奇數(shù)}={1,3,5}韩脏、事件B={骰到6}={6}=基本事件
2)事件A={骰到同一面}={(+,+),(-,-)}
3)事件A={抽到鬼牌}={}=不可能事件
定義四:事件A的機率:
其中缩麸,#(??) 表 A 事件中元素個數(shù),#(??) 表樣本空間中之元素個數(shù)赡矢。
● 事件 A 與 B 之間有三個可能的關(guān)係:
[??(??|??)為B發(fā)生的條件下A發(fā)生的機率],[??(??,??)為A,B同時發(fā)生的機率]
- 相依 (dependent) – 事件 A 的發(fā)生會受事件 B 的影響杭朱,反之亦然。
??(??,??) = ??(??|??)×??(??) = ??(??|??)×??(??) = P(A∩B)
??(??|??) = ??(??,??)÷??(??) = ??(??|??)×??(??)÷??(??) - 獨立 (independent) – 事件 A 的發(fā)生與事件 B 的發(fā)生無任何關(guān)係或彼此不會互相影響济竹。
??(??,??) = ??(??)×??(??) = P(A∪B)
??(??|??) = ??(??)
??(??|??) = ??(??) - 互斥 (mutually exclusive) – 若事件 A 與事件 B 不可能同時發(fā)生痕檬,則兩事件互斥。
??(??,??) = 0 = P(A∩B) = 0 = A∩B = ?
例 :假設兄弟隊與三商隊進行一場棒球賽送浊,在進行 9 局後,可能的結(jié)果有:{兄弟隊贏三商隊丘跌、兄弟隊輸三商隊袭景、兄弟隊與三商隊平手}。
令 A={兄弟隊贏三商隊}闭树, B={兄弟隊輸三商隊 }耸棒, C={兄弟隊與三商隊平手},則事件 A报辱,B 與 C 之間的關(guān)係為何与殃?
ABC互為互斥事件
● 機率三原理:
1)0 ≦ ??(??) ≦ 1 對樣本空間中任一事件 A
2)??(?)= 0 (無元素(空集合)機率=0), ??(??)= 1 (樣本空間(所有集合)機率=1)
3)若 ????, ????, ? ???? 互為互斥事件,則 ??(???? ∪ ???? ∪ ? ∪ ????) =??(??1)+??(??2)...+??(????)
例 :從五十二張撲克牌隨機抽出一張牌幅疼,求以下之機率:
A)抽出一張黑桃
B)抽出一張 K
C)抽出一張黑桃 K
D)抽出一張紅心 Q
E)抽出一張黑桃或 K?
S={?1,?1,?1,?1,?2,?2,?2,?2....,?13,?13,?13,?13}米奸,#S=52
A) 13/52
B) 4/52
C) 1/52
D) 1/52
E) P(A∪B) - P(A∩B) = ((13+4-1)/52) = 16/52
= 獨立發(fā)生的機率 - 同時發(fā)生的機率
= P(A)+P(B) - ??(??|??)×??(??) = (13/52)+(4/52)-((4/1)*(4/52))
= (17/52) - (1/52) = 16/52
例 :從五十二張撲克牌隨機抽出二張牌,求以下之機率:
A)出現(xiàn)黑桃
S={?1,?1,?1,?1,?2,?2,?2,?2....,?13,?13,?13,?13}爽篷,#S=52
A) (13/52)*(39/51)+(39/52)*(13/51)+(13/52)*(12/51)=15/34 = 0.4411
例 :從五十二張撲克牌隨機抽出一張牌放回悴晰,重複2次,求以下之機率:
A)出現(xiàn)黑桃
B)出現(xiàn) K
C)抽中黑桃後抽中紅心的機率
D)抽中黑桃同時又抽中紅心的機率
E)抽中黑桃後抽中K的機率
F)其一個為黑桃後有出現(xiàn)K的機率
S={?1,?1,?1,?1,?2,?2,?2,?2....,?13,?13,?13,?13}逐工,#S=52
A) ((13/52)*(13/52))+((13/52)*(39/52))+((39/52)*(13/52)) = 7/16 = 0.4375
B) ((4/52)*(4/52))+((4/52)*(48/52))+((48/52)*(4/52)) = 25/169 = 0.1479
C) ??(??|??) = ??(??) = 13/52
D) ??(??)×??(??) = (13/52)*(13/52)=1/16
E) ??(??|??) = ??(??) = 4/52
F) (1/4)*(4/52)+(1/4)*(48/52)+(3/4)*(4/52)=(1/52)+(12/52)+(3/52)=16/52=4/13
例 :假設生男生女的機率相等铡溪,則一個有三個小孩的家庭中,恰僅有一個女孩子的機率泪喊?
例 :假設生男生女的機率相等棕硫,則一個有兩個小孩的家庭中,條件B[大的女孩是女生]袒啼,條件A[兩個都是女生]饲帅,如果大的女孩是女生,兩個都是女生機率為何?
P(A|B)=P(A,B)/P(B)=??(??|??)*P(A)/P(B) = 1*((1/4)/(1/2))=1/2
補充: 排列組合
定義五:互補事件
任一事件 A 的互補事件為「A 不會發(fā)生的事件」瘤泪,以 A’表示灶泵。
※??(??′) = ?? ? ??(??)
例 :滾動兩個骰子,求兩個骰子出現(xiàn)不同點數(shù)的機率对途?
S= {(1,1),(1,2)..(1,6)..(6,6))}赦邻,#S=36
??(??’)= {(1,1),(2,2)....(6,6)},#??(??’)=6
??(??)= 1-(6/36)=5/6
條件機率(Conditional Probability)
條件機率 ??(??|??) 表在已知 B 事件已發(fā)生的條件下实檀,A 事件發(fā)生的機率惶洲。
-
貝氏定理 (Bays’ Theorem):
wiki
條件機率可改寫成下式
例 :電視臺想測量其天氣預報員的能力, 收集了過去的數(shù)據(jù)膳犹,表明以下內(nèi)容:
1)在晴天恬吕,預報員預報為晴天的概率為0.8。
2)在雨天须床,預報員預報為晴天的概率為0.4
3)晴天的概率是0.6铐料。
預報員預報是晴天,實際為晴天的機率為多少?
{預測為晴天}=P(B),{真正為晴天}=P(A), ??(??|??)=?
??(??|??)=P(A,B)/P(B) = (P(B|A)*P(A)/(P(B|A)*P(A)+P(B|~A)*P(~A))
= 0.8*0.6/(0.8*0.6+0.4*(1-0.6)) = 3/4 = 75%
- 例 :假設每10000人會有1人得癌癥豺旬,有一臺儀器可以檢測出癌癥準確率為99%钠惩,如果檢測到陽性,實際上得病的機率為多少?
ans:100萬人會100人得癌癥族阅,100人中會有99人檢測出陽性篓跛,999900健康的人中會有1%就是9999人檢測出陽性(機器誤判),也就是說(99+9999)個檢測為陽性的人中坦刀,只有99人 是真正的病的愧沟,所以得病機率是99/(9999+99)=0.98%
{檢驗為陽性}=P(B),{得到癌癥}=P(A), ??(??|??)=?
??(??|??)=P(A,B)/P(B) = (P(B|A)*P(A)/(P(B|A)*P(A)+P(B|~A)*P(~A))
= 0.99*0.0001/(0.99*0.0001+0.01*0.9999) = 0.98%
單元二.機率分佈 (Probability Distributions)
數(shù)值變數(shù)的兩種型式:
- 離散型
- 連續(xù)型
定義:離散型隨機變數(shù)(Discrete Random Variable)
- 離散型隨機變數(shù)為計數(shù)值的隨機變數(shù)蔬咬。例 :生產(chǎn)線上缺陷製品的數(shù)目、人數(shù)等沐寺。
定義:連續(xù)型隨機變數(shù)(Continuous Random Variable)
- 連續(xù)型隨機變數(shù)是連續(xù)值的隨機變數(shù)林艘。例 :厚度、重量與長度等
● 離散型隨機變數(shù)之機率分佈
定義:離散型隨機變數(shù)之機率分佈芽丹,是以圖或表來表示隨機變數(shù) X 的每一可能值之相關(guān)機率北启。
在傳統(tǒng)的統(tǒng)計學裡,大寫通常表示隨機變數(shù)拔第,小寫表示已實現(xiàn)值咕村。
p(x) 的特性為何?
i) 0 ≦ p(x) ≦ 1
ii) ∑?????? ?? ??(??) = 1如何找出離散型隨機變數(shù)的機率分佈?
1)先建立一表列出離散型隨機變數(shù) X 的所有可能值蚊俺。
2)再計算出每一 x 之相對機率 p(x)懈涛。例 :擲一枚硬幣兩次,令 x 表硬幣人頭朝上(正面)的次數(shù)泳猬。
a) 求 X 的機率分佈
b) 將 p(x)繪成圖批钠。
S={(++),(+-),(-+),(--)}
-
離散型隨機變數(shù)的期望值
設 X 為一離散型隨機變數(shù),其機率分配為 P(x)得封,則 X 的期望值為
例 :擲一枚硬幣兩次埋心,令 X 表硬幣人頭朝上(正面)的次數(shù),
a) 求 X 的期望值
-
離散型隨機變數(shù)的變異數(shù)與標準差
設 X 為一離散隨機變數(shù)忙上,其機率分配為 P(x)拷呆,則
-
例 :擲一枚硬幣兩次,令 X 表硬幣人頭朝上(正面)的次數(shù)疫粥,
a) 求 x 的變異數(shù)
-
例 :我們得到以下之機率分配茬斧,
a) 求出現(xiàn)正面的期望次數(shù)(E(x)), b) 求x 的變異數(shù)與標準差梗逮。
- 例 :假設臺北市建國南北路高架橋在星期五的尖峰時段项秉,發(fā)生交通意外次數(shù)為 0,1慷彤,2娄蔼,3 的機率分別為 0.93,0.02瞬欧,0.03及 0.02贷屎,
a) 試找出在星期五尖峰時段發(fā)生交通意外的期望次數(shù)。
b) 一年的期間內(nèi)艘虎,在星期五尖峰時段發(fā)生交通意外的期望次數(shù)是多少?
c) 試找出在星期五尖峰時段發(fā)生交通意外的變異數(shù)與標準差咒吐。
第四章.離散型隨機變數(shù)(Discrete Random Variables)
離散型機率分佈
-
常用的離散型機率分佈
– 白努力分佈(Bernoulli Probability Distribution)
– 二項分佈(Binomial Probability Distribution)
– 超幾何分佈(Hypergeometric Probability Distribution)
– 波瓦松分佈(Poisson Probability Distribution)
– 負二項分佈(Negative Binomial Probability Distribution)
– 幾何分佈(Geometric Probability Distribution)
二項分佈(Binomial Probability Distribution)
何謂二項實驗野建?
一個實驗必須滿足以下四個條件属划,才能稱為二項實驗:
1)此一實驗獨立、重複的試行n次候生。
2)每一試行均產(chǎn)生兩個結(jié)果:成功(Success)或失敗(Failure)同眯。
3)每一試行成功的機率均為 p,失敗的機率為(1-p)或 q唯鸭。
4)我們對試行n次中须蜗,成功 X 次之機率有興趣。-
二項機率分佈
– 在n次獨立的二項實驗試行中目溉,出現(xiàn)x次成功的機率為
? n 表全部的試行數(shù)
? x 表在n次試行中成功的次數(shù)明肮;
? C(n, x) 表n次試行中取 x 次成功次數(shù)的組合數(shù);
? p 表每一試行成功的機率缭付;
? q=1-p 表每一試行失敗的機率柿估。
-
二項隨機變數(shù)的平均數(shù)與變異數(shù)
- 例:某製成品中約有10%為不良品,今任取10個成品檢查陷猫,求其中含有
a) 兩個不良品數(shù)之機率秫舌?
b) 少於兩個不良品數(shù)之機率?
(a)8個良品的機率(x=8)绣檬,n=10(滿足1)足陨,良品.不良品(滿足2),p=0.9(滿足3)娇未,q=0.1(滿足4)
-------------------------------------------------
(a)2個不良品的機率(x=2)墨缘,n=10(滿足1),良品.不良品(滿足2)忘蟹,p=0.1(滿足3)飒房,q=0.9(滿足4)
(b))少於兩個不良品數(shù)之機率(x=1,x=0),n=10(滿足1)媚值,良品.不良品(滿足2)狠毯,p=0.1(滿足3),q=0.9(滿足4)
-
補充:階層計算
-
例:設某考試有20題五選一之單選題褥芒,若能答對至少12題嚼松,就算通過。假設你每一題均隨機猜答案锰扶,請問你通過該考試的機會有多大献酗?ans:0.01%
n-20,試行結(jié)果: S='猜對(獨立事件)',F='答錯'
p=P(S)=1/5=0.2坷牛,q=P(F)=4/5=0.8
P(通過考試)=P(x≥12)=P(12)+P(13)+.....P(20)
超幾何分佈(Hypergeometric Probability Distribution)
超幾何隨機變數(shù)
1.實驗包括從一組N個元素中隨機抽取n個元素罕偎,其中一個是N個元素,其中一個是S(用於成功)京闰,其中(N-a)是F(用於失斞占啊)甩苛。
2.超幾何分布是統(tǒng)計學上一種離散機率分布,它描述了由有限個物件中抽出n個物件俏站, 成功抽出指定種類的物件的個數(shù)(不歸還 (without replacement))讯蒲。
3.超幾何隨機變量X是n個元素的繪製中的S的數(shù)量。-
超幾何機率分佈
– 超幾何隨機變數(shù)x之機率分佈如下(抽出x個成功元素的機率):
? N = 群體總數(shù)(total number of elements)
? a = 群體中成功的元素個數(shù)( Number of S’s in the N elements)
? n = 從群體中抽取n個元素( Number of elements drawn)
? x = 抽取n個元素中成功的個數(shù)( Number of S’s drawn in the n
elements)
-
超幾何隨機變數(shù)X的平均數(shù)與變異數(shù)
-
例: 雇主從10個應徵者中挑3個肄扎,10個中有6個男性墨林、4個女性,設X為女性的人數(shù)犯祠。
1)給出X的概率函數(shù)旭等。
2)找出沒有女性被雇用的概率。
3)在選擇中找出女性人數(shù)超過男性的概率雷则。
4)計算E(X)和Var(X)
-
例: 一批100臺錄音機包含25臺有缺陷的錄音機辆雾。
如果隨機選擇其中10個進行檢查,則通過使用找出10個中有2個有缺陷的概率月劈。
1)超幾何分佈的公式;(每次抽出抽到機率不同)
2)二項分佈的公式作為近似值(因為二項分佈每次抽出抽到機率都相同)
如果N>>n度迂,那麼超幾何分佈近似二項分佈。
-
以二項分佈近似超幾何分佈
波瓦松分佈(Poisson Probability Distribution)
波瓦松分佈是用來形容在某一特定時間或面積內(nèi)稀有事件發(fā)生之機率猜揪。
波瓦松隨機變數(shù)的一些例子:
1)幾週內(nèi)保險公司收到的要保信數(shù)
2)幾分鐘內(nèi)經(jīng)過剪票口的旅客數(shù)
3)一段短時間內(nèi)經(jīng)轉(zhuǎn)接的電話次數(shù)
4)一段時間內(nèi)地震發(fā)生次數(shù)-
波瓦松機率分佈
– 假設事件是隨機且彼此獨立的發(fā)生惭墓,單位時間的平均次數(shù)為 λ ,而 x 表示一段時間事件發(fā)生的次數(shù)而姐,則波瓦松機率密度函數(shù)如下:
? μ = 波瓦松分佈事件在某一特定時間(或面積)內(nèi)發(fā)生的平均數(shù)
? λ = 單位時間(或面積)內(nèi)發(fā)生的平均數(shù)
? t = 特定之時間(或面積)
? e = 2.718281828
-
波瓦松何隨機變數(shù)的平均數(shù)與變異數(shù)
-
利用機率表尋找波瓦松機率 (Cumulative Poisson Probabilities)
以波瓦松分佈近似二項分佈
當n很大且p很小時(優(yōu)選????≤??)腊凶,μ=np,泊松概率分佈為二項概率提供了良好的近似拴念。例:ABC公司生產(chǎn)的平板玻璃窗內(nèi)的氣泡數(shù)目為一波瓦松分佈钧萍,平均每平方呎有0.004個氣泡,試求
a) 100平方呎所生產(chǎn)的玻璃窗內(nèi)無氣泡的機率
b) 100平方呎所生產(chǎn)的玻璃窗內(nèi)氣泡數(shù)不超過1個的機率
x = 氣泡數(shù)目政鼠,λ = 0.004 1/ft2风瘦,t = 100 ft2,λt = 0.004*100 = μ =0.4
- 例: 到達Bay Bank櫃員窗口的顧客數(shù)量為泊松分佈公般,平均每分鐘0.75人万搔。
a)兩位客戶在接下來的6分鐘內(nèi)到達的概率是多少?
b)使用表格在(a)中找到答案
x = 顧客數(shù)目官帘,λ = 0.75 /min瞬雹,t =6 min,λt = 0.75*6 = 4.5
(x=2) = (x≤2) - (x≤1)
- 例: 假設一個大型食品加工和罐裝廠有20臺自動罐裝機在運行刽虹。 如果個別裝罐機在給定日期內(nèi)發(fā)生故障的概率為.05酗捌,則找出在給定日期2裝罐機失效的概率。
a)使用二項分佈計算確切的概率。 (使用附錄中的表格意敛。)
b)計算泊松近似馅巷。
c)比較a)和b)中獲得的答案膛虫。
n=20,(正常.失效)草姻,x=2,p=0.05稍刀,q=0.95撩独,μ=np=20*0.05=1
負二項分佈(Negative Binomial Probability Distribution)
-
何謂負二項實驗?
一個實驗必須滿足下列個條件账月,才能稱為負二項實驗综膀。
- 某一實驗獨立、重複的試行 y 次
- 每一試行均產(chǎn)生兩結(jié)果:成功(Success)或失敗(Failure)
- 每一試行成功的機率均為 p夺英,失敗的機率為(1-p)或 q
- 我們對出現(xiàn)第 r 次成功所經(jīng)歷的試行次數(shù) y 有興趣
-
負二項機率分佈
– 負二項隨機變數(shù)Y之機率分佈如下:
? p = 每一試行成功的機率
? q = 每一試行失敗的機率
? y = y =觀察到rth成功之前的試驗次數(shù)扯罐。
-
負二項隨機變數(shù)的平均數(shù)與變異數(shù)
- 例 :要將外殼安裝在電機上戒悠,生產(chǎn)線裝配商必須使用電動手持工具來固定和擰緊四個螺栓。 假設在任何1秒的時間間隔內(nèi)設置和擰緊螺栓的概率為p = .8讥此。
如果彙編程序在第一秒內(nèi)失敗,則在第二個1秒間隔內(nèi)成功的概率為.8谣妻,依此類推萄喳。
a)找出Y的概率分佈,即連接完整住房之前的時間長度蹋半。
b)求p(6)他巨。
c)求出Y的均值和方差。
幾何分佈(Geometric Probability Distribution)
幾何分佈是負二項分佈的一個特例
幾何分佈是負二項分佈的特例减江。 它涉及單次成功所需的試驗次數(shù)染突。 因此,幾何分佈是負二項分佈辈灼,其中成功次數(shù)(r)等於1份企。-
幾何機率分佈
對於特殊情況r = 1,Y的概率分佈稱為幾何概率分佈茵休。 (Y表示出現(xiàn)第1次成功所經(jīng)歷的試驗次數(shù))
?p =單次伯努利試驗的成功概率
?q = 1- p
?y =觀察到第一次成功之前的試驗次數(shù)
- 例: 保險絲大批量購買並按順序測試薪棒,直至觀察到第一個有缺陷的保險絲。 假設該批次包含10%有缺陷的保險絲榕莺。
a)第一個有缺陷的保險絲是測試的前五個保險絲之一的概率是多少俐芯?
b)求出Y的平均值,方差和標準偏差钉鸯,即在觀察到第一個有缺陷的保險絲之前測試的保險絲數(shù)量吧史。