課程連結(jié):
臺(tái)灣交通大學(xué) 統(tǒng)計(jì)學(xué)(一) Statistics I 唐麗英老師
[統(tǒng)計(jì)學(xué)筆記及整理]
第五章 連續(xù)型隨機(jī)變數(shù)(Continuous Random Variables)
隨機(jī)變數(shù)(R.V.)的兩種型式
-
定義:離散型隨機(jī)變數(shù) (Discrete Random Variable)
– 離散型隨機(jī)變數(shù)為計(jì)數(shù)值的隨機(jī)變數(shù)(計(jì)數(shù))牛曹。
– 例:生產(chǎn)線上某次抽檢之不良品的數(shù)目 -
定義:連續(xù)型隨機(jī)變數(shù) (Continuous Random Variable)
– 連續(xù)型隨機(jī)變數(shù)為連續(xù)值的隨機(jī)變數(shù)(量測(cè))母剥。
– 例:厚度蚁吝、重量與長(zhǎng)度
- 例:以下每個(gè)實(shí)驗(yàn)都會(huì)產(chǎn)生一個(gè)隨機(jī)變量值(一次測(cè)量)。
1.說(shuō)明隨機(jī)變量是離散變量還是連續(xù)變量疤苹。
2.至少在原則上確定隨機(jī)變量的所有可能值妓布。
a)樹上的葉子數(shù)量叛拷。
離散型腾窝,x = 0,1,2.....
b)閱讀“如何撒謊統(tǒng)計(jì)”一書所需的時(shí)間
連續(xù)型卷员,x >0
c)陪審團(tuán)中的女性人數(shù)為12人盈匾。
離散型,x = 0,1,2.....12
d)過(guò)往車輛的速度毕骡。
連續(xù)型削饵,x >0
e)翻轉(zhuǎn)硬幣兩次時(shí)觀察到的頭數(shù)。
離散型未巫,x = 0,1,2
f)一次滾動(dòng)一對(duì)公平骰子時(shí)出現(xiàn)的兩個(gè)數(shù)字的總和窿撬。
離散型,x = 2,3,4,..12
累加函數(shù) The (Cumulative) Distribution Function
名詞:
1 ) 累加分怖函數(shù) (Cumulative) Distribution Function(簡(jiǎn)稱c.d.f. or d.f.)
2 ) 概率密度函數(shù) (Probability) Density Function(簡(jiǎn)稱p.d.f.)
3 ) 概率質(zhì)量函數(shù) (Probability) Mass Function(簡(jiǎn)稱p.m.f.)"機(jī)率質(zhì)量函數(shù)"和"機(jī)率密度函數(shù)"不同之處在於:
機(jī)率質(zhì)量函數(shù)是對(duì)離散隨機(jī)變量定義的叙凡,本身代表該值的機(jī)率劈伴;
機(jī)率密度函數(shù)是對(duì)連續(xù)隨機(jī)變量定義的,本身不是機(jī)率握爷,只有對(duì)連續(xù)隨機(jī)變量的機(jī)率密度函數(shù)在某區(qū)間內(nèi)進(jìn)行積分後才是機(jī)率跛璧。-
Def:累加函數(shù) The (Cumulative) Distribution Function(簡(jiǎn)稱c.d.f. or d.f.)
隨機(jī)變量X的分佈函數(shù)(c.d.f.)被定義為
-
備註:
如果X是離散的R.V.,那麼
-
離散型概率函數(shù)如果使用連續(xù)型累加函數(shù)新啼,則定積分累加起來(lái)時(shí)總機(jī)率會(huì)超過(guò)1追城。
-
Example:
- 例:假設(shè)一頂帽子包含四張紙; 每個(gè)滑動(dòng)帶有數(shù)字1,2,3和4.從帽子中抽出一個(gè)滑動(dòng)而不看。 設(shè)X是繪製的單位上的數(shù)字燥撞。
1)X的概率函數(shù)是多少座柱?
2)X的累加函數(shù)是什麼?
3)繪製X的累加函數(shù)物舒。
P(x)=0(x<1)色洞,P(x)=1/4(x=1,2,3,4),P(x)=0(x>4)
-
累加函數(shù)的特性
備註:我們可以使用c.d.f. 冠胯,F(xiàn)X(t)火诸,用於評(píng)估X在特定區(qū)間內(nèi)的概率。
連續(xù)隨機(jī)變量的密度函數(shù)(The Density Function for a Continuous Random Variable)
Def:連續(xù)隨機(jī)變量
-X是一個(gè)連續(xù)的隨機(jī)變量涵叮,如果它的累加函數(shù)惭蹂,F(xiàn)X(t)是X的連續(xù)函數(shù),for ?∞ < ?? < ∞ .
-對(duì)於連續(xù)的R.V. X割粮,概率函數(shù)的作用取自概率密度函數(shù)f(x)盾碗。-
Def:連續(xù)R.V.的概率密度函數(shù)
-設(shè)X是具有累加函數(shù)的連續(xù)隨機(jī)變量,F(xiàn)(x)= P(X≤x)舀瓢。
-X的概率密度函數(shù)是:
-連續(xù)R.V.的範(fàn)圍 X是Rx = {x | f(x)≥0}
image.png
-
Example
-
連續(xù)型概率密度函數(shù)的屬性f(x):
-
備註:
-如果X是連續(xù)的R.V. 使用密度函數(shù)f(x)廷雅,然後對(duì)於任何a <b,X落入?yún)^(qū)間(a,b)的概率是a和b之間密度函數(shù)下的面積:
-如果X是連續(xù)的R.V.航缀,則X取任何特定值的概率為0:
-如果X是連續(xù)的R.V.商架,那麼
注意:對(duì)於離散的R.V.,情況並非如此芥玉。
-
c.d.f. 也可以定義為
-
c.d.f. 可用於評(píng)估X在某個(gè)區(qū)間內(nèi)的概率:
期望值和綜合性指標(biāo)(Expected Values and Summary Measures)
?衡量機(jī)率函數(shù)“重心”之指標(biāo)(Measure of the Center of a probability Function)
衡量機(jī)率函數(shù)“重心”之指標(biāo):平均值或期望值灿巧。
-
回想:"離散型" 隨機(jī)變量的期望值
如果X是離散的R.V. 使用概率質(zhì)量函數(shù)p(x)赶袄,X的期望值,由E(X)或μX(希臘字母mu)表示抠藕,是
注意:E(X)=μX是概率函數(shù)的平衡點(diǎn)
-
Def:"連續(xù)型"隨機(jī)變量的期望值
如果X是連續(xù)的R.V. 密度函數(shù)f(x)敬辣,X的預(yù)期值是
E(X)是X的所有可能值的加權(quán)平均值溉跃,每個(gè)值由其相關(guān)概率加權(quán)。
?衡量機(jī)率函數(shù)”變異”之指標(biāo)(Measure of the variability of a Probability Function)
衡量機(jī)率函數(shù)”變異”之指標(biāo):差異(變異)或標(biāo)準(zhǔn)差
-
Def:任何 R.V. X的方差和標(biāo)準(zhǔn)差
-
Def:設(shè)X為連續(xù)R.V. 的概率密度函數(shù)f(x)门粪,讓g(X)為X的任何函數(shù)喊积。然後g(X)的期望值通式是
-
定理5.1:設(shè)X為連續(xù)的R.V.烹困,並且讓g1(X)玄妈,g2(X),...髓梅,gk(X)為X的k個(gè)函數(shù)拟蜻。然後,
-
定理5.2:設(shè)X為連續(xù)R.V. E(X) 枯饿,然後酝锅,
-
定理5.3:設(shè)X為連續(xù)R.V. ,E(X)=μ??奢方,Var(X)=σ??2搔扁。如果Y = aX + b,其中a和b是任何常數(shù)蟋字,那麼
- 例:假設(shè)E(X)= 5稿蹲,Var(X)= 10,查找
a) E(3X-5)
b) Var(3X-5)
c) Std(3X-5)
a)(3X-5)= Y鹊奖,E(Y) = 3*E(X)-5 = 3*5-5 = 10
b)(3X-5)= Y苛聘,Var(Y) = 32*102 = 9*10 = 90
c)(3X-5)= Y,Std(Y) = Var(Y)1/2 =901/2
- 例:設(shè)X是連續(xù)的R.V. 有(機(jī)率)密度函數(shù)
a)
![]()
b)
- 例:如果T是連續(xù)的R.V. 與c.d.f.
對(duì)c.d.f. 做積分
,
设哗,
連續(xù)型機(jī)率分佈(Continuous Probability Distributions)
常用的連續(xù)型機(jī)率分佈
1)常態(tài)分佈(Normal Distribution)
2)對(duì)數(shù)常態(tài)分佈(Lognormal Distribution)
3)齊一分佈(Uniform Distribution)
4)珈瑪分佈(Gamma Distribution)
5)指數(shù)分佈(Exponential Distribution)
6)韋伯分佈(Weibull Distribution)
7)貝塔分佈(Beta Distribution)-
常態(tài)分佈(Normal Distribution)
-
何謂常態(tài)分佈唱捣?
自然界所觀察到的許多連續(xù)型隨機(jī)變數(shù)常呈鐘形分佈,如下圖所示网梢。此鐘形分佈又稱為常態(tài)分佈(或高斯分佈)震缭。
-
常態(tài)機(jī)率分佈
?=數(shù)學(xué)常數(shù)近似為3.1416
? =數(shù)學(xué)常數(shù)近似為2.718
?=總體均值或真實(shí)平均數(shù)
?=總體方差
?以N(μ,σ)表示
-
常態(tài)曲線
-
N(μ,σ) 的特性
1)對(duì)稱於 μ战虏。
2)隨機(jī)變數(shù) x 之值可由 -∞ 至 +∞ 蛀序。
3)鐘形分佈。
4)曲線下之面積為 1 活烙。
5)集中趨勢(shì)的三個(gè)量數(shù)(平均數(shù)徐裸、中位數(shù)及眾數(shù))是一致的。
-
μ 與 σ 如何影響常態(tài)曲線
由1)與2)可知:
μ - 位置參數(shù)(Location parameter)
σ - 變異參數(shù)(Dispersion parameter)-
何謂標(biāo)準(zhǔn)常態(tài)分佈啸盏?
– 平均數(shù)為0重贺、標(biāo)準(zhǔn)差為1之常態(tài)分佈稱為標(biāo)準(zhǔn)常態(tài)分佈,以 N(0,1) 表之回懦。
– 例:令Z為 N(0,1) 之隨機(jī)變數(shù)气笙,亦即Z~N(0,1),其常態(tài)曲線如下圖怯晕。則潜圃,P(2≦Z≦3) = 曲線下介於2與3之間的面積=陰影部份之面積
-
如何利用表查出標(biāo)準(zhǔn)常態(tài)之機(jī)率(若無(wú)表則需直接代入高斯分怖公式,運(yùn)算較複雜舟茶。)
– 設(shè) Z~N(0, 1),請(qǐng)利用表找出下列之機(jī)率:
1)P(0.53≦Z≦2.42) = 0.4922-0.2019 = 0.2903
2)P(-1.81≦Z≦1.81) = 0.4649+0.4649 = 0.9298
3)P(0≦Z≦1.96) = 0.4750
4)P(Z≧-0.36) = 0.1406+0.5 = 0.6406
設(shè) Z~N(0, 1)吧凉,請(qǐng)利用表 C 值:
1)P(Z < C) = 0.95隧出,0.95 - 0.5 = 0.45,C=1.645
2)P(Z > C) = 0.7019阀捅,0.7019 - 0.5 = 0.2019胀瞪,C=0.53
3)P(Z > C) = 0.1379,0.5 - 0.1379 = 0.3621饲鄙,C=1.09
4)P(Z < C) = 0.0110凄诞,0.5 - 0.0110 = 0.489,C=2.29
- 如何求出一般常態(tài)變數(shù)之機(jī)率
– 作法:先將其標(biāo)準(zhǔn)化(Standardize)忍级,轉(zhuǎn)換成標(biāo)準(zhǔn)常態(tài)變數(shù)後帆谍,再求其機(jī)率。標(biāo)準(zhǔn)化之公式如下:
-
例:設(shè) X~N(10,2) 颤练,平均數(shù)=10既忆,標(biāo)準(zhǔn)差=2
a) 請(qǐng)找出 X 介於 11 與 13.6 間之機(jī)率
b) 請(qǐng)找出 X 大於 12 之機(jī)率
-
例:假設(shè)某產(chǎn)品之長(zhǎng)度資料呈常態(tài)分佈驱负,其平均數(shù)為38.5公分,標(biāo)準(zhǔn)差為2.5公分患雇。若此產(chǎn)品之規(guī)格界限為38±2跃脊,請(qǐng)問(wèn)此產(chǎn)品之不良率為何?(μ=38.5苛吱,σ=2.5)
檢查數(shù)據(jù)是否呈常態(tài)分佈
1)利用直方圖– 只要出現(xiàn)鐘形分佈圖形酪术,即判定數(shù)據(jù)呈常態(tài)分佈
2)利用常態(tài)機(jī)率圖– 只要圖形呈直線,即判定數(shù)據(jù)呈常態(tài)分佈
3)利用統(tǒng)計(jì)檢定– 只要顯著度 p-value > 0.05翠储,即判定數(shù)據(jù)呈常態(tài)分佈
a. 卡方適配度檢定(Chi-Square Goodness-of-fit Test)
b. K-S檢定(Kolmogorov-Smirnov test)
c. A-D檢定(Anderson-Darling Test)-
例:下列 75 筆數(shù)據(jù)為某模具上的孔徑尺寸值(mm)绘雁,請(qǐng)檢查數(shù)據(jù)是否呈常態(tài)分佈?
-
對(duì)數(shù)常態(tài)分佈(Lognormal Distribution)
- 對(duì)數(shù)常態(tài)分佈
如果隨機(jī)變數(shù)Y=ln(X)為平均值μ以及標(biāo)準(zhǔn)差σ之常態(tài)分佈援所,則連續(xù)隨機(jī)變數(shù) X 稱為對(duì)數(shù)常態(tài)分佈庐舟,而且其密度函數(shù)為
- μ:常態(tài)分佈Y的μ
-
σ:常態(tài)分佈Y的σ
- 對(duì)數(shù)常態(tài)分佈X的平均值μ與變異數(shù)σ2 分別為
- 例 :The current gain of certain transistors is measured in units which make it equal to the logarithm of ????/????, the ratio of the output to the input current. If it is normally distributed with μ = 2 and σ2 = 0.01, find
1)The probability that ????/???? will take on a value between 6.1 and 8.2.
2)The mean and the variance of the distribution of ????/????
齊一分佈(Uniform Distribution)
-
當(dāng)且僅當(dāng)X在區(qū)間(α住拭,β)上均勻分佈時(shí)挪略,連續(xù)隨機(jī)變量X稱為均勻隨機(jī)變量,即X的密度為
-
均勻R.V的均值和方差
例 如果X均勻分佈在(0,10)上滔岳,則計(jì)算出概率
a) X < 3
b) X > 6
c) 3 < X < 8
a) X < 3杠娱,
b)X > 6,
c)3 < X < 8谱煤,
- 例: 假設(shè)一家鋼鐵製造商的研究部門認(rèn)為該公司的一臺(tái)軋機(jī)正在生產(chǎn)不同厚度的鋼板摊求。 厚度Y是均勻的隨機(jī)變量,其值在150和200mm之間刘离。 任何厚度小於160毫米的薄板都必須報(bào)廢室叉,因?yàn)樗鼈儗?duì)買方來(lái)說(shuō)是不可接受的。
a)計(jì)算Y的平均值和標(biāo)準(zhǔn)偏差寥闪,即本機(jī)生產(chǎn)的紙張厚度太惠。 然後繪製概率分佈圖磨淌,並在橫軸上顯示平均值疲憋。 還顯示圍繞平均值的1和2標(biāo)準(zhǔn)偏差間隔。
b)計(jì)算該機(jī)器生產(chǎn)的鋼板必須報(bào)廢的比例梁只。
150~200機(jī)率密度為1/50
(a)
(b)
缚柳,良品比不良品=4:1
珈瑪分佈(Gamma Distribution)
幾個(gè)重要的概率密度(如指數(shù),威布爾)是伽馬分佈的特例搪锣。
-
Def:X被稱為Gamma隨機(jī)變量秋忙,當(dāng)且僅當(dāng)
其中Γ(α)是伽馬函數(shù)的值
-
Gamma function
Gamma function的屬性
1)Γ(α) < ∞,????α> 0
2)Γ(α) = (α - 1)Γ(α - 1)构舟,if α> 1
3)Γ(α) = (α - 1)!,if α是正整數(shù)-
Gamma R.V的均值和方差
-
卡方分佈(The Chi-Square Probability Distribution)
卡方隨機(jī)變量是具有且
的伽馬型隨機(jī)變量
稱為自由度灰追。
-
卡方隨機(jī)變量的均值和方差是:
-
例:根據(jù)過(guò)去的經(jīng)驗(yàn),製造商知道主要客戶產(chǎn)品投訴之間的時(shí)間長(zhǎng)度Y(以月為單位)(投訴的間隔時(shí)間)的相對(duì)頻率分佈可以通過(guò)α= 2且β= 4的伽馬密度函數(shù)來(lái)建模。 在製造商收緊質(zhì)量控制要求15個(gè)月後弹澎,第一個(gè)投訴就到了朴下。 這是否表明主要客戶投訴之間的平均時(shí)間可能會(huì)增加?
由於Y = 15個(gè)月的平均值(μ+σ= 8 + 5.7 = 13.7個(gè)月)不超過(guò)1個(gè)標(biāo)準(zhǔn)差苦蒿,我們不會(huì)將15個(gè)月視為Y的異常大的數(shù)值殴胧。因此,我們可以得出結(jié)論佩迟, 證據(jù)不足以表明公司新的質(zhì)量控制計(jì)劃在增加投訴之間的平均時(shí)間方面是有效的团滥。
指數(shù)分佈(Exponential Distribution)
- X稱為指數(shù)隨機(jī)變量,當(dāng)且僅當(dāng)
- 指數(shù)分佈是Gamma分佈的一個(gè)特例报强,α= 1
- 均勻R.V的均值和方差
-
例:觀察反應(yīng)的核工程師測(cè)量β粒子排放之間的時(shí)間間隔灸姊。
-
這些衰減時(shí)間(以毫秒為單位)在下圖中顯示為直方圖
備註:
-可以證明,與泊松過(guò)程相關(guān)秉溉,連續(xù)到達(dá)之間的等待時(shí)間具有指數(shù)分佈厨钻。
-更具體地說(shuō),可以證明坚嗜,如果在泊松過(guò)程中平均到達(dá)率(每單位時(shí)間的平均到達(dá)次數(shù))是λ=??/β夯膀,則直到第一次到達(dá)的時(shí)間,或者連續(xù)到達(dá)之間的等待時(shí)間苍蔬, 具有??/β的指數(shù)分佈诱建。