如何計(jì)算置信區(qū)間

一拆内、置信區(qū)間與置信水平

在做實(shí)驗(yàn)時(shí)旋圆,即使實(shí)驗(yàn)條件再準(zhǔn)確,也無法避免隨機(jī)干擾的影響麸恍,所以誤差永遠(yuǎn)存在灵巧,無可避免。做科學(xué)實(shí)驗(yàn)時(shí)要測量多次抹沪,采取取平均值的方法刻肄。在科學(xué)實(shí)驗(yàn)的測量結(jié)果上,總是會加上一個測量范圍融欧。

統(tǒng)計(jì)學(xué)核心思想:用樣本信息來估計(jì)總體信息

之前我們用樣本給出一個精確值來估計(jì)總體敏弃,這個點(diǎn)估計(jì)值是有價(jià)值的,但可能存在誤差噪馏,因?yàn)橛泄烙?jì)就會有誤差麦到,誤差不可避免但是可以減少。

點(diǎn)(精確值)誤差 > 區(qū)間(范圍)誤差

點(diǎn)估計(jì)

[圖片上傳失敗...(image-491647-1618377925287)]

圖中橫軸是不同樣本的平均值從小到大逝薪,紅色虛線表示要求的總體平均值隅要,假設(shè)將抽樣的過程重復(fù)5次,那么就有了5個樣本董济,可以算出5個樣本平均值的點(diǎn)估計(jì)步清,也就是藍(lán)色的點(diǎn)代表總體樣本。

[圖片上傳失敗...(image-2e6bd9-1618377925287)]

如果圖中有許多藍(lán)色的點(diǎn)虏肾,每一個藍(lán)色的點(diǎn)都是對總體平均值的一次點(diǎn)估計(jì)廓啊,這么多點(diǎn)估計(jì),我們是分辨不出那個點(diǎn)估計(jì)更好的封豪,也就是說谴轮,我們無法知道估計(jì)的準(zhǔn)確程度是多少,反過來說吹埠,我們是不知道誤差范圍的第步,為了解決點(diǎn)估計(jì)存在的問題,需要運(yùn)用區(qū)間估計(jì)缘琅。

假如想要知道全國男性的平均身高粘都,這只能通過抽樣的方法,用樣本信息估計(jì)出總體信息刷袍,從全國成年男性中隨機(jī)抽取一個樣本翩隧,這個樣本的平均值就是對總體平均值的一次點(diǎn)估計(jì),當(dāng)有多個樣本時(shí)具有多個點(diǎn)估計(jì)呻纹,由于無法判別那個點(diǎn)估計(jì)對總體估計(jì)的誤差范圍更小堆生,所以要用區(qū)間估計(jì)來解決這個問題专缠。

比如說,全國成年男性的平均身高在165cm~175cm這個區(qū)間[165, 175]淑仆,那么這個區(qū)間就叫做置信區(qū)間涝婉。

置信區(qū)間是統(tǒng)計(jì)中一種區(qū)間估計(jì)的方法。用[a , b]表示樣本估計(jì)總體平均值誤差范圍的區(qū)間糯景,由于a和b的確切數(shù)值取決于我們希望自己對于這個區(qū)間包含總體平均值這一結(jié)果具有的可信程度嘁圈,因此這個區(qū)間叫做置信區(qū)間。

[圖片上傳失敗...(image-d127cf-1618377925287)]

有五個樣本蟀淮,樣本的總體平均值是上圖中的藍(lán)色點(diǎn),對樣本的總體平均值使用某種方法钞澳,構(gòu)造一個置信區(qū)間怠惶,則5個樣本的平均值就有五個置信區(qū)間,也就是圖中黃色和紅色的橫線轧粟,哪一根橫線更好呢策治,我們?nèi)稳徊恢溃呛忘c(diǎn)估計(jì)相比兰吟,因?yàn)檫@次是按照95%的置信水平構(gòu)造出的區(qū)間估計(jì)通惫,那么我們可以相信,圖中除了紅色那根線混蔼,沒有包含總體平均值之外履腋,其他線都包含了總體平均值。這個結(jié)論的相信程度有多大呢惭嚣?也就是說遵湖,如果有100個樣本,可以構(gòu)造出100個這樣的區(qū)間晚吞,其中大約有95個區(qū)間會包含總體平均值延旧。這也解釋了什么是置信水平。

image

置信水平是指包含總體平均值的概率是多大槽地,例如:95%的置信水平表示迁沫,如果有100個樣本,可以構(gòu)造出100個這樣的區(qū)間捌蚊,有95%的可能性包含總體平均值集畅。所以說,如果只做一次抽樣逢勾,那么這個樣本包含總體平均值的概率也是95%牡整。

image

二、大樣本計(jì)算置信區(qū)間的四個步驟

1. 確定要求解的問題

用樣本信息估計(jì)總體信息

2. 求樣本的平均值和標(biāo)準(zhǔn)誤差

當(dāng)樣本大小大于30時(shí)抽樣分布符合中心極限定理溺拱,也就是抽樣分布是正態(tài)分布的

image

總體標(biāo)準(zhǔn)差不知道逃贝,但可以用樣本標(biāo)準(zhǔn)差來估計(jì)總體標(biāo)準(zhǔn)差谣辞,標(biāo)準(zhǔn)誤差其實(shí)也是標(biāo)準(zhǔn)差,只不過標(biāo)準(zhǔn)誤差的計(jì)算對象是所有的“樣本平均值”沐扳,標(biāo)準(zhǔn)誤差是用來衡量所有的“樣本平均值”的波動大小

image

3. 確定置信水平

置信水平取多大泥从,完全取決于具體情況,以及對區(qū)間中包含總體平均值這一說法有多大信心沪摄。

置信水平越高躯嫉,區(qū)間越寬,置信區(qū)間包含總體平均值的概率也就越大杨拐。常用的置信水平為95%祈餐。

[圖片上傳失敗...(image-55c4ad-1618377925287)]

根據(jù)中心極限定理,不管總體服從什么分布哄陶,任意一個樣本的平均值都會圍繞在總體平均值周圍呈現(xiàn)正態(tài)分布帆阳,所以圖中中間位置的紅色豎線就是總體平均值,根據(jù)正態(tài)分布的經(jīng)驗(yàn)法則屋吨,有95%的樣本平均值會落在兩個標(biāo)準(zhǔn)誤差之內(nèi)蜒谤。

4. 求置信區(qū)間上下限的值

image

上圖中上下限ba是根據(jù)總體平均值對稱分布的,可以根據(jù)求a從而來求b至扰,上圖的距離平均值的幾個標(biāo)準(zhǔn)誤差就是幾個標(biāo)準(zhǔn)分鳍徽,只要求出a對應(yīng)的標(biāo)準(zhǔn)分是多少就可以了,用z來表示標(biāo)準(zhǔn)分敢课,那么如何求z的值呢阶祭?

下圖是求z的值的方法

image
image
image

根據(jù)中心極限定理,樣本平均值約等于總體平均值翎猛。根據(jù)上圖就可以求出ab了

置信區(qū)間公式中的z是指其絕對值|z| ,公式修正如下:

a=總體平均值- |z|* 標(biāo)準(zhǔn)誤差

b=總體平均值+ |z|* 標(biāo)準(zhǔn)誤差

大樣本計(jì)算置信區(qū)間的總結(jié)

image
image
image

置信區(qū)間公式中的z是指其絕對值|z| ,公式修正如下:

a=總體平均值- |z|* 標(biāo)準(zhǔn)誤差

b=總體平均值+ |z|* 標(biāo)準(zhǔn)誤差

三胖翰、小樣本計(jì)算置信區(qū)間的四個步驟

當(dāng)樣本大小小于30時(shí),抽樣分布符合t分布切厘,t分布很像正態(tài)分布萨咳,曲線較為扁平,有兩條突出的尾巴

[圖片上傳失敗...(image-89cbb1-1618377925287)]

上圖中的n指的是樣本大小疫稿,df指的是自由度

小樣本的置信區(qū)間與大樣本的置信區(qū)間只有一點(diǎn)不同培他,也就是第三步所查詢的表格不同

image

置信區(qū)間公式中的t是指其絕對值|t| ,公式修正如下:

a=總體平均值- |t|* 標(biāo)準(zhǔn)誤差

b=總體平均值+ |t|* 標(biāo)準(zhǔn)誤差

image
image
image

自由度是指,可選的樣本大小中遗座,減去最后一次沒有選擇可選的只剩下1個樣本的數(shù)量多少舀凛。

如:有四種水果,每天選擇吃完一種途蒋,到第四天時(shí)猛遍,只有唯一的一種水果可吃了,此時(shí)沒有其他選擇了,這時(shí)自由度為3懊烤。

image
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末梯醒,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子腌紧,更是在濱河造成了極大的恐慌茸习,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件壁肋,死亡現(xiàn)場離奇詭異号胚,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)浸遗,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進(jìn)店門猫胁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人跛锌,你說我怎么就攤上這事杜漠。” “怎么了察净?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長盼樟。 經(jīng)常有香客問我氢卡,道長,這世上最難降的妖魔是什么晨缴? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任译秦,我火速辦了婚禮,結(jié)果婚禮上击碗,老公的妹妹穿的比我還像新娘筑悴。我一直安慰自己,他們只是感情好稍途,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布阁吝。 她就那樣靜靜地躺著,像睡著了一般械拍。 火紅的嫁衣襯著肌膚如雪突勇。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天坷虑,我揣著相機(jī)與錄音甲馋,去河邊找鬼。 笑死迄损,一個胖子當(dāng)著我的面吹牛定躏,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼痊远,長吁一口氣:“原來是場噩夢啊……” “哼垮抗!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起拗引,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤借宵,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后矾削,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體壤玫,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年哼凯,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了欲间。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡断部,死狀恐怖猎贴,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蝴光,我是刑警寧澤她渴,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站蔑祟,受9級特大地震影響趁耗,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜疆虚,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一苛败、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧径簿,春花似錦罢屈、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至暗赶,卻和暖如春鄙币,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蹂随。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工十嘿, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人岳锁。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓绩衷,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子咳燕,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,077評論 2 355

推薦閱讀更多精彩內(nèi)容