搬運https://blog.csdn.net/xo3ylAF9kGs/article/details/102493337
學(xué)習(xí)&Mark
參數(shù)95%的置信度在區(qū)間A的意思是:
正確:采樣100次計算95%置信度的置信區(qū)間物喷,有95次計算所得的區(qū)間包含真實值措嵌。
錯誤:采樣100次,有95次真實值落在置信區(qū)間朵诫。
真實值不會變恰力,變得是置信區(qū)間狰右。
1.點估計
在講置信度和置信區(qū)間之前先講講點估計貌嫡,那什么是點估計呢?給你舉兩個例子你就知道了庆猫。
現(xiàn)在你想要知道一個學(xué)校學(xué)生的身高情況认轨,你可以把所有的學(xué)生測量一遍,然后得到答案月培,這種方法可以嘁字,而且得到的數(shù)據(jù)肯定是最真實的恩急,但是這里有一個問題,什么問題呢纪蜒?就是如果學(xué)生人數(shù)太多衷恭,全部測量的話工作量太大了,那怎么辦呢纯续?那就隨機挑選一部分學(xué)生随珠,然后測量這一部分學(xué)生的身高,得到一個值(一般用平均值)猬错,用這一部分的平均值來估計整體學(xué)生的身高情況窗看,我們把這種估計方式稱為點估計。
現(xiàn)在你要看一下某流水線上 iphone 手機的不合格率倦炒,怎么看呢显沈?最笨的方法還是把所有的手機全部開機試用,統(tǒng)計不合格手機的占比析校,這樣可以嗎构罗?很明顯是不可以的。那怎么才能知道這一條流水線的質(zhì)量智玻,那就是抽樣,抽取整條流水線上的部分手機進(jìn)行檢驗芙代,會得到一個合格率吊奢,然后用這個合格率去估計整條流水線的合格率,同樣這種方式也是點估計纹烹。
那現(xiàn)在是不是大概理解點估計的意思了页滚,就是用隨機抽樣的樣本的計算出來的指標(biāo)值去估計整體指標(biāo)情況。常用的點估計方法有如下:
用樣本均值估計總體均值
2.區(qū)間估計
以前上學(xué)的時候經(jīng)常會考試铺呵,考完試以后老愛去估分裹驰,一般人估分不太可能直接估一個具體的數(shù),肯定都是估一個大概的數(shù)片挂,啥叫大概的數(shù)呢幻林?就是比如高考分?jǐn)?shù)預(yù)計 600?左右,這個左右其實就是一個區(qū)間音念,還有平常很多食品包裝袋上會寫?±0.5 KG沪饺,表示啥意思呢?就是要么多給了你?0.5 KG闷愤,要么少給了你?0.5 KG整葡。我們把這種用一個范圍來對一個事情進(jìn)行估計的方式稱為區(qū)間估計,得出來的區(qū)間就是置信區(qū)間讥脐。
3.置信度
你是估算出一個區(qū)間了遭居,但是你估算的準(zhǔn)不準(zhǔn)呢啼器?準(zhǔn)確度又有多大呢?我們把這個估算的區(qū)間的準(zhǔn)確度(可信度)稱為置信度俱萍。比如說我有 95%?的把握估計我高考分?jǐn)?shù)是 600-650镀首,這里的置信區(qū)間就是?[600,650],置信度就是 95%鼠次。
一般置信度和置信區(qū)間是同向的更哄,啥意思呢?就是置信度和置信區(qū)間一般是相同趨勢腥寇。當(dāng)置信度很高時成翩,置信區(qū)間也會很大;當(dāng)置信區(qū)間很大時赦役,置信度也會很高麻敌。
比如我有 100%?的把握估計我高考分?jǐn)?shù)是?0-750,這里的置信區(qū)間是?[0,750]?包含了所有分?jǐn)?shù)的可能掂摔,那置信度肯定是 100%?哈术羔。
4.如何計算置信區(qū)間
那么我們該如何通過部分樣本來計算總體的一個置信區(qū)間呢?主要有下面幾個步驟:
step1:首先明確要求解的問題乙漓。就是你要預(yù)估什么级历?不管是全校學(xué)生身高還是學(xué)生成績。
step2:求抽樣樣本的平均值與標(biāo)準(zhǔn)誤差(standard error)叭披。注意標(biāo)準(zhǔn)誤差與標(biāo)準(zhǔn)差(standard deviation)不一樣(標(biāo)準(zhǔn)差反映了整個樣本對樣本平均數(shù)的離散程度寥殖,標(biāo)準(zhǔn)誤差反映樣本平均數(shù)對總體平均數(shù)的變異程度)。
標(biāo)準(zhǔn)差等于方差開根號涩蜘。
step3:確定需要的置信水平嚼贡。比如常用的 95%?的置信水平,就是我有 95%?的把握估算對同诫,這樣可以保證樣本的均值會落在總體平均值2個標(biāo)準(zhǔn)差范圍內(nèi)粤策。
step4:查z表,求z值误窖。什么是z表呢叮盘?是不是已經(jīng)忘記了,z表是標(biāo)準(zhǔn)正態(tài)分布表贩猎,是用來反映標(biāo)準(zhǔn)分與概率值之間的關(guān)系表熊户,也就是通過標(biāo)準(zhǔn)分能查到概率值,通過概率值也可以反查標(biāo)準(zhǔn)分吭服。
現(xiàn)在我們知道了 95%?的置信水平對應(yīng)的概率值是 2.5%?嚷堡,只需要通過標(biāo)準(zhǔn)正態(tài)分布表查出 2.5%?概率對應(yīng)的標(biāo)準(zhǔn)分即可,也就是z值。
常用置信水平與標(biāo)準(zhǔn)分z值的對應(yīng)表
置信水平Z值
??????????? 90%????????? 1.64
??????????? 95%????????? 1.96
??????????? 99%?????????? 2.58
step5:計算置信區(qū)間
a = 樣本均值 - z*標(biāo)準(zhǔn)誤差
b = 樣本均值 + z*標(biāo)準(zhǔn)誤差
最后置信區(qū)間就為?[a,b]蝌戒。