作業(yè)思路
習(xí)題1:投擲N枚硬幣啃勉,正面出現(xiàn)57次双妨,嘗試通過計算回答,假設(shè)N=100枚泣特,要舍棄還是接受挑随?
tips:投擲N枚硬幣的數(shù)據(jù)近似于均值為N/2,S.D.為sqrt(N)/2的正態(tài)分布兜挨。
假設(shè)95%的置信區(qū)間是可接受的,若57被包含在該區(qū)間中柒桑,則接受噪舀,否則舍棄
μ=N/2=50,σ=sqrt(N)/2=5
代入方程 1.96 ≤ (X - μ)/ σ ≤ +1.96界逛,解方程得95%的置信區(qū)間纺座。
習(xí)題2:隨機抽樣30個GRE成績,平均分數(shù)為1082分该溯,標(biāo)準差為108分别惦,決定下列參數(shù)的95%和99%置信區(qū)間。
1)總體均值
2)總體標(biāo)準差
剛開始看到題目氯庆,我也有點發(fā)蒙,均值和標(biāo)準差不是已經(jīng)知道了么堤撵,還要怎么求呢实昨?google了一會,才明白已知的均值和標(biāo)準差只是局部的荒给,基于當(dāng)前抽樣的,不能等同于總體的∈镅剩現(xiàn)在是要從局部推導(dǎo)總體挑辆,把總體均值和總體標(biāo)準差都看做是變量,求它們的95%和99%的置信區(qū)間洒嗤。
我們都知道蚀乔,如果X服從正態(tài)分布,則有1.96 ≤ (X - μ)/ σ ≤ +1.96 的區(qū)間概率為95%。
- 求總體均值的置信區(qū)間
問題轉(zhuǎn)化為婉弹,求出總體均值的均值镀赌,總體均值的標(biāo)準差,代入上述方程商佛,便可獲得總體均值的95%置信區(qū)間良姆。
設(shè)μμ為該總體均值的均值玛追,σμ為總體均值的標(biāo)準差闲延,這兩個值怎么求呢韩玩?
μμ用抽樣得出的均值代替。作業(yè)中的抽樣均值為1082.
根據(jù)總體平均數(shù)的估計中的公式合愈,σμ的求法分為兩種情況:
- 當(dāng)總體標(biāo)準差σ已知時击狮,σμ=σ/sqrt(N)
- 當(dāng)總體標(biāo)準差σ未知時,無偏估計:σμ=S/sqrt(N)说莫,有偏估計:σμ=S/sqrt(N-1)寞焙。S為樣本的標(biāo)準差。
作業(yè)中的總體標(biāo)準差未知辽狈,采用有偏估計σμ=S/sqrt(N-1)=108/sqrt(30-1)
代入前面的方程
-1.96 ≤ (X - 1082)/ (108/sqrt(30-1) )≤ 1.96 呛牲,解方程得95%置信區(qū)間
同理,求總體均值99%的置信區(qū)間着茸,解方程
2.576 ≤ (X - 1082)/ (108/sqrt(30-1) )≤ 2.576
- 求總體標(biāo)準差的置信區(qū)間
問題轉(zhuǎn)化為琐旁,求出總體標(biāo)準差的均值,總體標(biāo)準差的標(biāo)準差敬特,代入上述方程
設(shè)μσ為總體標(biāo)準差的均值牺陶,σσ為總體標(biāo)準差的標(biāo)準差,這兩個值怎么求呢皱炉?
根據(jù) 標(biāo)準差與方差的區(qū)間估計 ,當(dāng)樣本容量n>30時碱工,樣本標(biāo)準差的分布漸近正態(tài)分布奏夫,
由該文中的公式可知:
μσ=抽樣的標(biāo)準差酗昼。作業(yè)中的抽樣標(biāo)準差為108梳猪。
σσ=S/sqrt(2N),S為抽樣標(biāo)準差即108.
代入得方程
-1.96 ≤ (X - 108)/ (108/sqrt(2*30) )≤ 1.96 春弥,解方程得95%的置信區(qū)間置信區(qū)間
-2.576 ≤ (X - 108)/ (108/sqrt(2*30) )≤ 1.96匿沛,解方程得99%的置信區(qū)間置信區(qū)間為
還有一種方法是求方差的置信區(qū)間,再開平方鳖孤,用的是卡方分布抡笼。具體見 標(biāo)準差與方差的區(qū)間估計 。
1.以上解法平匈,是基于一定的前提:若分布X服從正態(tài)分布藏古,則其均值和標(biāo)準差也服從正態(tài)分布。否則應(yīng)該是不能這樣做的弟跑。
2.根據(jù)標(biāo)準差與方差的區(qū)間估計,在總體方差未知時防症,樣本平均數(shù)的分布為t分布哎甲,所以應(yīng)該要查t值表。
但我不知道如果已知總體分布是正態(tài)分布奈嘿,是不是可以用正態(tài)表的值比如1.96吞加?
3.兩個參數(shù)為什么可以用這樣的公式求得尽狠,我也不清楚叶圃,暫且理解為用一系列數(shù)學(xué)公式推導(dǎo)出來的掺冠,統(tǒng)計學(xué)還得繼續(xù)看……
寫完才看到石頭同學(xué)的作業(yè),推導(dǎo)專業(yè)多了斥黑∶汲看了小密圈里其他同學(xué)的作業(yè),我的總體標(biāo)準差的區(qū)間和大家的出入比較大鹿蜀,同學(xué)們是先通過卡方分布求總體方差荔燎,再求標(biāo)準差。但我看到標(biāo)準差與方差的區(qū)間估計中的 例1也是這樣求的琐簇,是做法的不同座享,還是我的理解是錯誤的?
用ipython 求方程的解
import sympy #導(dǎo)入sympy庫丈秩,用于數(shù)學(xué)計算
x = sympy.Symbol('x') #將x轉(zhuǎn)換成符號淳衙,才能用在后面的方程中
sympy.solve(x * 2 - 4, x) #以一個簡單線性方程為例,第一個參數(shù)為要解的方程肠牲,要求右端等于0靴跛,第二個參數(shù)為要解的未知數(shù)。解為2肥印。
[2]
習(xí)題1:求解方程1.96 ≤ (X - μ)/ σ ≤ +1.96,μ=N/2=50腹鹉,σ=sqrt(N)/2=5
sympy.solve((x - 50)/5+1.96,x)
[40.2000000000000]
sympy.solve((x - 50)/5-1.96,x)
[59.8000000000000]
置信區(qū)間為[40.2,59.80]莹痢,所以57是可以接受的
習(xí)題2:求總體均值的95%置信區(qū)間
sympy.solve((x - 1082)/ (108/(30-1)**0.5)+1.96,x) #求總體均值95%的置信區(qū)間
[1042.69201081468]
sympy.solve((x - 1082)/ (108/(30-1)**0.5)-1.96,x)
[1121.30798918532]
置信區(qū)間為[1042.69,1121.3]
習(xí)題2:求總體均值的99%置信區(qū)間
sympy.solve((x - 1082)/ (108/(30-1)**0.5)+2.576,x)
[1030.33807135644]
sympy.solve((x - 1082)/ (108/(30-1)**0.5)-2.576,x)
[1133.66192864356]
置信區(qū)間為[1030.33,1133.66]
習(xí)題2:求總體標(biāo)準差的95%置信區(qū)間
sympy.solve((x - 108)/ (108/(2*30)**0.5)+1.96,x)
[80.6722295091604]
sympy.solve((x - 108)/ (108/(2*30)**0.5)-1.96,x)
[135.327770490839]
置信區(qū)間為[80.67,135.32]
習(xí)題2:求總體標(biāo)準差的99%置信區(qū)間
sympy.solve((x - 108)/ (108/(2*30)**0.5)+2.576,x)
[72.0835016406109]
sympy.solve((x - 108)/ (108/(2*30)**0.5)-2.576,x)
[143.916498359389]
置信區(qū)間為 [72.08,143.91]