解密大數(shù)據(jù)課程作業(yè)-正態(tài)分布的應(yīng)用

作業(yè)思路

習(xí)題1:投擲N枚硬幣啃勉,正面出現(xiàn)57次双妨,嘗試通過計算回答,假設(shè)N=100枚泣特,要舍棄還是接受挑随?
tips:投擲N枚硬幣的數(shù)據(jù)近似于均值為N/2,S.D.為sqrt(N)/2的正態(tài)分布兜挨。

假設(shè)95%的置信區(qū)間是可接受的,若57被包含在該區(qū)間中柒桑,則接受噪舀,否則舍棄
μ=N/2=50,σ=sqrt(N)/2=5
代入方程 1.96 ≤ (X - μ)/ σ ≤ +1.96界逛,解方程得95%的置信區(qū)間纺座。

習(xí)題2:隨機抽樣30個GRE成績,平均分數(shù)為1082分该溯,標(biāo)準差為108分别惦,決定下列參數(shù)的95%和99%置信區(qū)間。
1)總體均值
2)總體標(biāo)準差

剛開始看到題目氯庆,我也有點發(fā)蒙,均值和標(biāo)準差不是已經(jīng)知道了么堤撵,還要怎么求呢实昨?google了一會,才明白已知的均值和標(biāo)準差只是局部的荒给,基于當(dāng)前抽樣的,不能等同于總體的∈镅剩現(xiàn)在是要從局部推導(dǎo)總體挑辆,把總體均值和總體標(biāo)準差都看做是變量,求它們的95%和99%的置信區(qū)間洒嗤。

我們都知道蚀乔,如果X服從正態(tài)分布,則有1.96 ≤ (X - μ)/ σ ≤ +1.96 的區(qū)間概率為95%。

  • 求總體均值的置信區(qū)間
    問題轉(zhuǎn)化為婉弹,求出總體均值的均值镀赌,總體均值的標(biāo)準差,代入上述方程商佛,便可獲得總體均值的95%置信區(qū)間良姆。

設(shè)μμ為該總體均值的均值玛追,σμ為總體均值的標(biāo)準差闲延,這兩個值怎么求呢韩玩?
μμ用抽樣得出的均值代替。作業(yè)中的抽樣均值為1082.

根據(jù)總體平均數(shù)的估計中的公式合愈,σμ的求法分為兩種情況:

  1. 當(dāng)總體標(biāo)準差σ已知時击狮,σμ=σ/sqrt(N)
  2. 當(dāng)總體標(biāo)準差σ未知時,無偏估計:σμ=S/sqrt(N)说莫,有偏估計:σμ=S/sqrt(N-1)寞焙。S為樣本的標(biāo)準差。

作業(yè)中的總體標(biāo)準差未知辽狈,采用有偏估計σμ=S/sqrt(N-1)=108/sqrt(30-1)

代入前面的方程

-1.96 ≤ (X - 1082)/ (108/sqrt(30-1) )≤ 1.96 呛牲,解方程得95%置信區(qū)間

同理,求總體均值99%的置信區(qū)間着茸,解方程
2.576 ≤ (X - 1082)/ (108/sqrt(30-1) )≤ 2.576

  • 求總體標(biāo)準差的置信區(qū)間
    問題轉(zhuǎn)化為琐旁,求出總體標(biāo)準差的均值,總體標(biāo)準差的標(biāo)準差敬特,代入上述方程
    設(shè)μσ為總體標(biāo)準差的均值牺陶,σσ為總體標(biāo)準差的標(biāo)準差,這兩個值怎么求呢皱炉?
    根據(jù) 標(biāo)準差與方差的區(qū)間估計 ,當(dāng)樣本容量n>30時碱工,樣本標(biāo)準差的分布漸近正態(tài)分布奏夫,
    由該文中的公式可知:
    μσ=抽樣的標(biāo)準差酗昼。作業(yè)中的抽樣標(biāo)準差為108梳猪。
    σσ=S/sqrt(2N),S為抽樣標(biāo)準差即108.

代入得方程
-1.96 ≤ (X - 108)/ (108/sqrt(2*30) )≤ 1.96 春弥,解方程得95%的置信區(qū)間置信區(qū)間

-2.576 ≤ (X - 108)/ (108/sqrt(2*30) )≤ 1.96匿沛,解方程得99%的置信區(qū)間置信區(qū)間為

還有一種方法是求方差的置信區(qū)間,再開平方鳖孤,用的是卡方分布抡笼。具體見 標(biāo)準差與方差的區(qū)間估計

1.以上解法平匈,是基于一定的前提:若分布X服從正態(tài)分布藏古,則其均值和標(biāo)準差也服從正態(tài)分布。否則應(yīng)該是不能這樣做的弟跑。
2.根據(jù)標(biāo)準差與方差的區(qū)間估計,在總體方差未知時防症,樣本平均數(shù)的分布為t分布哎甲,所以應(yīng)該要查t值表。
但我不知道如果已知總體分布是正態(tài)分布奈嘿,是不是可以用正態(tài)表的值比如1.96吞加?
3.兩個參數(shù)為什么可以用這樣的公式求得尽狠,我也不清楚叶圃,暫且理解為用一系列數(shù)學(xué)公式推導(dǎo)出來的掺冠,統(tǒng)計學(xué)還得繼續(xù)看……

寫完才看到石頭同學(xué)的作業(yè),推導(dǎo)專業(yè)多了斥黑∶汲看了小密圈里其他同學(xué)的作業(yè),我的總體標(biāo)準差的區(qū)間和大家的出入比較大鹿蜀,同學(xué)們是先通過卡方分布求總體方差荔燎,再求標(biāo)準差。但我看到標(biāo)準差與方差的區(qū)間估計中的 例1也是這樣求的琐簇,是做法的不同座享,還是我的理解是錯誤的?

用ipython 求方程的解

import sympy #導(dǎo)入sympy庫丈秩,用于數(shù)學(xué)計算
x = sympy.Symbol('x') #將x轉(zhuǎn)換成符號淳衙,才能用在后面的方程中
sympy.solve(x * 2 - 4, x) #以一個簡單線性方程為例,第一個參數(shù)為要解的方程肠牲,要求右端等于0靴跛,第二個參數(shù)為要解的未知數(shù)。解為2肥印。
[2]

習(xí)題1:求解方程1.96 ≤ (X - μ)/ σ ≤ +1.96,μ=N/2=50腹鹉,σ=sqrt(N)/2=5

sympy.solve((x - 50)/5+1.96,x)
[40.2000000000000]
sympy.solve((x - 50)/5-1.96,x)
[59.8000000000000]

置信區(qū)間為[40.2,59.80]莹痢,所以57是可以接受的

習(xí)題2:求總體均值的95%置信區(qū)間

sympy.solve((x - 1082)/ (108/(30-1)**0.5)+1.96,x) #求總體均值95%的置信區(qū)間
[1042.69201081468]
sympy.solve((x - 1082)/ (108/(30-1)**0.5)-1.96,x)
[1121.30798918532]

置信區(qū)間為[1042.69,1121.3]

習(xí)題2:求總體均值的99%置信區(qū)間

sympy.solve((x - 1082)/ (108/(30-1)**0.5)+2.576,x)
[1030.33807135644]
sympy.solve((x - 1082)/ (108/(30-1)**0.5)-2.576,x)
[1133.66192864356]

置信區(qū)間為[1030.33,1133.66]

習(xí)題2:求總體標(biāo)準差的95%置信區(qū)間

sympy.solve((x - 108)/ (108/(2*30)**0.5)+1.96,x)
[80.6722295091604]
sympy.solve((x - 108)/ (108/(2*30)**0.5)-1.96,x)
[135.327770490839]

置信區(qū)間為[80.67,135.32]

習(xí)題2:求總體標(biāo)準差的99%置信區(qū)間

sympy.solve((x - 108)/ (108/(2*30)**0.5)+2.576,x)
[72.0835016406109]
sympy.solve((x - 108)/ (108/(2*30)**0.5)-2.576,x)
[143.916498359389]

置信區(qū)間為 [72.08,143.91]


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末航瞭,一起剝皮案震驚了整個濱河市坦辟,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌滨彻,老刑警劉巖挪蹭,帶你破解...
    沈念sama閱讀 217,509評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件梁厉,死亡現(xiàn)場離奇詭異,居然都是意外死亡八秃,警方通過查閱死者的電腦和手機肉盹,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評論 3 394
  • 文/潘曉璐 我一進店門上忍,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人萌衬,你說我怎么就攤上這事。” “怎么了朴艰?”我有些...
    開封第一講書人閱讀 163,875評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長侮穿。 經(jīng)常有香客問我,道長回铛,這世上最難降的妖魔是什么克锣? 我笑而不...
    開封第一講書人閱讀 58,441評論 1 293
  • 正文 為了忘掉前任袭祟,我火速辦了婚禮,結(jié)果婚禮上您没,老公的妹妹穿的比我還像新娘胆绊。我一直安慰自己,他們只是感情好仆抵,可當(dāng)我...
    茶點故事閱讀 67,488評論 6 392
  • 文/花漫 我一把揭開白布何缓。 她就那樣靜靜地躺著碌廓,像睡著了一般。 火紅的嫁衣襯著肌膚如雪谷婆。 梳的紋絲不亂的頭發(fā)上纪挎,一...
    開封第一講書人閱讀 51,365評論 1 302
  • 那天,我揣著相機與錄音通砍,去河邊找鬼。 笑死封孙,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的泡徙。 我是一名探鬼主播膜蠢,決...
    沈念sama閱讀 40,190評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼挑围,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了苏章?” 一聲冷哼從身側(cè)響起奏瞬,我...
    開封第一講書人閱讀 39,062評論 0 276
  • 序言:老撾萬榮一對情侶失蹤硼端,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后珍昨,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體镣典,經(jīng)...
    沈念sama閱讀 45,500評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡兔毙,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,706評論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了兄春。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片澎剥。...
    茶點故事閱讀 39,834評論 1 347
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖赶舆,靈堂內(nèi)的尸體忽然破棺而出哑姚,到底是詐尸還是另有隱情,我是刑警寧澤芜茵,帶...
    沈念sama閱讀 35,559評論 5 345
  • 正文 年R本政府宣布叙量,位于F島的核電站,受9級特大地震影響九串,放射性物質(zhì)發(fā)生泄漏绞佩。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,167評論 3 328
  • 文/蒙蒙 一征炼、第九天 我趴在偏房一處隱蔽的房頂上張望析既。 院中可真熱鬧,春花似錦谆奥、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,779評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至檐蚜,卻和暖如春魄懂,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背闯第。 一陣腳步聲響...
    開封第一講書人閱讀 32,912評論 1 269
  • 我被黑心中介騙來泰國打工市栗, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人咳短。 一個月前我還...
    沈念sama閱讀 47,958評論 2 370
  • 正文 我出身青樓填帽,卻偏偏與公主長得像,于是被迫代替她去往敵國和親咙好。 傳聞我的和親對象是個殘疾皇子篡腌,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,779評論 2 354

推薦閱讀更多精彩內(nèi)容