參數(shù)估計(jì)是在樣本統(tǒng)計(jì)量概率分布的基礎(chǔ)上,根據(jù)樣本信息跳纳,推斷總體參數(shù)忍饰。總體參數(shù)用θ表示寺庄,用于估計(jì)參數(shù)的統(tǒng)計(jì)量用θ上加一個(gè) ^ 表示艾蓝,θ^也稱(chēng)為估計(jì)量,根據(jù)一個(gè)具體的樣本計(jì)算出來(lái)的估計(jì)量的數(shù)值成為估計(jì)值斗塘。
參數(shù)估計(jì)的方法
方法有兩種:點(diǎn)估計(jì)赢织、區(qū)間估計(jì)。
點(diǎn)估計(jì)
點(diǎn)估計(jì)指的是用估計(jì)量的某個(gè)取值馍盟,作為總體參數(shù)θ的估計(jì)值于置。比如用樣本均值作為總體均值的估計(jì)值,用樣本比例作為總體比例的估計(jì)值等等朽合。再比如俱两,某個(gè)產(chǎn)品的樣本良品率是97%,將97%作為這一批產(chǎn)品的良品率曹步。
所以你可以看到宪彩,點(diǎn)估計(jì)的估計(jì)可靠性一般,因?yàn)橐蕾?lài)于估計(jì)量的可靠性讲婚,估計(jì)量的可靠性是有其抽樣分布的標(biāo)準(zhǔn)誤來(lái)衡量的尿孔。這么一來(lái),無(wú)法說(shuō)出點(diǎn)估計(jì)值與總體參數(shù)的真實(shí)值接近程度筹麸,我們就需要找其他的解決辦法活合,比如圍繞估計(jì)值構(gòu)造一個(gè)總體參數(shù)的區(qū)間。
區(qū)間估計(jì)
區(qū)間估計(jì)是在點(diǎn)估計(jì)的基礎(chǔ)上得到總體參數(shù)的一個(gè)估計(jì)區(qū)間物赶,通常區(qū)間是由樣本統(tǒng)計(jì)量±估計(jì)誤差得來(lái)白指。進(jìn)行區(qū)間估計(jì)時(shí),根據(jù)樣本統(tǒng)計(jì)量的抽樣分布酵紫,可以對(duì)統(tǒng)計(jì)量與筒體參數(shù)的接近程度給出一個(gè)概率度量告嘲。
實(shí)際情況,樣本均值已知總體均值未知奖地,我們求的就是總體均值橄唬。可以理解為参歹,總體均值在樣本均值的兩側(cè)對(duì)稱(chēng)分布仰楚,所以我們可以利用標(biāo)準(zhǔn)誤估計(jì)總體均值在多少個(gè)標(biāo)準(zhǔn)誤內(nèi)可以作為總體均值的置信區(qū)間。
置信區(qū)間說(shuō)的就是,在區(qū)間估計(jì)中僧界,由于樣本估計(jì)量構(gòu)造出的總體參數(shù)在一定置信水平下的估計(jì)區(qū)間侨嘀。其中最小值成為區(qū)間下限,最大值成為區(qū)間上限捂襟。我們有哪個(gè)百分?jǐn)?shù)將區(qū)間劃分成100份飒炎,95%稱(chēng)為置信水平(也就是距離樣本均值±1.96個(gè)標(biāo)準(zhǔn)誤的距離),在這個(gè)置信區(qū)間中包含總體參數(shù)真值次數(shù)所占的比例是置信水平笆豁,或成為置信度、置信系數(shù)赤赊。
-置信區(qū)間告訴我們?cè)诙啻喂烙?jì)得到的區(qū)間中,大概有多少個(gè)區(qū)間包含參數(shù)的真值;
-實(shí)際運(yùn)用中過(guò)寬的區(qū)間意義不大偷溺,過(guò)窄區(qū)間容易漏掉真值跨释;
總體參數(shù)真值固定,樣本區(qū)間數(shù)量不固定吹截;
評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)
用于估計(jì)總體參數(shù)的估計(jì)量θ^有很多瘦陈,什么樣的估計(jì)量算比較好的呢?
無(wú)偏性
無(wú)偏性說(shuō)的是:估計(jì)量抽樣分布的期望值=被估計(jì)的總體參數(shù)〔ǘ恚現(xiàn)在有所選估計(jì)量的θ^晨逝, 總體參數(shù)θ,如果E(θ^ )=θ懦铺,則θ^是θ的無(wú)偏估計(jì)量捉貌。
效性
有效性指的是估計(jì)量的方差大小。表示了估計(jì)量接近總體參數(shù)的程度冬念,同一個(gè)總體的無(wú)偏估計(jì)量有非常多個(gè)趁窃,離散最小的則是最好的。
【例】
從均值為0急前、方差為1的總體抽取10000個(gè)樣本量為10的樣本:
1)計(jì)算樣本均值方差和樣本中位數(shù)方差醒陆;
2)進(jìn)行無(wú)偏性和有效性度量模擬;
# 創(chuàng)建向量test裆针,利用R語(yǔ)言解答需要用到循環(huán)語(yǔ)法:
#基本語(yǔ)法
# for (變量 in 條件) {
# 循環(huán)體
# }
test<-c(1,2,5,7,9)
for (i in test) {
print(i)
}
無(wú)偏估計(jì)的算法:
# vector函數(shù)能創(chuàng)建一個(gè)指定類(lèi)型和長(zhǎng)度的矢量刨摩,比如vector("numeric",2)。
# rnorm(統(tǒng)計(jì)量, 平均數(shù), 標(biāo)準(zhǔn)差)据块。
# append為給向量添加元素的函數(shù)码邻,append(要添加到哪個(gè)向量上, 要添加的元素是什么, after = length(x)從目標(biāo)向量的第幾個(gè)元素后添加),如果不指定after另假,則從目標(biāo)向量的最后一個(gè)數(shù)字后添加像屋。
# 創(chuàng)造可以制定長(zhǎng)度和類(lèi)型的三個(gè)變量對(duì)象
x<-vector();m<-vector();v<-vector()
# 設(shè)置樣本量為10
n=10
# 變量i按照條件1~10000進(jìn)行循環(huán),每次循環(huán)的數(shù)據(jù)需要滿(mǎn)足統(tǒng)計(jì)量為10边篮、樣本均值為0己莺、標(biāo)準(zhǔn)方差為1 的d數(shù)據(jù)
# 接下來(lái)的每一次循環(huán)所得的數(shù)據(jù)將給x奏甫、m、v分別追加:為x對(duì)象追加d數(shù)據(jù)的均值凌受;為m對(duì)象追加d數(shù)據(jù)的中位數(shù)阵子;為v對(duì)象追加d數(shù)據(jù)的方差。
for (i in 1:10000) {
d<-rnorm(n,0,1)
x<-append(x,mean(d))
m<-append(m,median(d))
v<-append(v,var(d))
}
# 計(jì)算x胜蛉、m挠进、v各自的平均值,并組合成數(shù)據(jù)框輸出
data.frame(mean(x),mean(m),mean(v))
通過(guò)上面的例子的結(jié)果可以看出:
- 無(wú)偏估計(jì)中誊册,對(duì)樣本均值领突、樣本方差、樣本中位數(shù)取平均值進(jìn)行比較案怯,結(jié)果都近似于總體均值君旦。總體方差嘲碱、總體中位數(shù)金砍;
有效性的算法:
#接下來(lái)循環(huán)同樣的數(shù)據(jù),但重新命名變量麦锯;
x1<-vector();m1<-vector();v1<-vector()
n=10
for (i in 1:10000) {
d1<-rnorm(n,0,1)
x1<-append(x1,mean(d1))
m1<-append(m1,median(d1))
v1<-append(v1,var(d1))
}
# 循環(huán)后的樣本計(jì)算他們的方差恕稠,進(jìn)行對(duì)比
data.frame(var(x1),var(m1),var(v1))
通過(guò)上面的例子的結(jié)果可以看出:
- 檢驗(yàn)有效性時(shí),采用了另一組同樣分布的數(shù)據(jù)變量扶欣,比較樣本均值谱俭、樣本方差、樣本中位數(shù)的方差宵蛀,發(fā)現(xiàn)樣本均值的方差數(shù)字最小昆著,所以是表現(xiàn)更有效的估計(jì)量。
一致性
一致性指的是隨著樣本量無(wú)限增大术陶,統(tǒng)計(jì)量會(huì)最終收斂于所估總體的參數(shù)內(nèi)凑懂。也就是說(shuō),大樣本的估計(jì)量更加接近總體參數(shù)梧宫。
# set.seed生成隨機(jī)數(shù)接谨,括號(hào)里的數(shù)據(jù)代表生成的是第幾次隨機(jī)數(shù)
set.seed(12)
# 變量N是:“樣本量為1000,均值為50塘匣,標(biāo)準(zhǔn)差為10”的一組數(shù)據(jù)
N=rnorm(1000,50,10)
mu=mean(N)
# sample為抽樣函數(shù)脓豪,sample(從什么總體中抽樣,抽樣的次數(shù)忌卤,有無(wú)放回T代表有放回)
x10<-mean(sample(N,10,replace = F))
x100<-mean(sample(N,100,replace = F))
x500<-mean(sample(N,500,replace = F))
x900<-mean(sample(N,900,replace = F))
data.frame(總體均值=mu,x10,x100,x500,x900)
通過(guò)上面的例子的結(jié)果可以看出:
- 抽樣字?jǐn)?shù)越多扫夜,最終的樣本參數(shù)約接近總體參數(shù)。
總體均值的區(qū)間估計(jì)
研究總體時(shí),推斷總體均值的統(tǒng)計(jì)量就是樣本均值笤闯,研究?jī)蓚€(gè)總體時(shí)堕阔,關(guān)心的參數(shù)是兩個(gè)總體均值的差值,用于推斷的統(tǒng)計(jì)量則是兩個(gè)樣本的均值之差颗味。
一個(gè)總體均值的估計(jì)
在對(duì)一個(gè)總體均值進(jìn)行區(qū)間估計(jì)時(shí)超陆,需要考慮抽取樣本的總體是否是正態(tài)分布、總體方差是否已知浦马、用于估計(jì)的樣本是否為大樣本(n≥30)還是小樣本时呀。
總體均值的置信區(qū)間都是由樣本均值甲減估計(jì)誤差得到的。所以估計(jì)誤差有兩部分組成:點(diǎn)估計(jì)的標(biāo)準(zhǔn)誤晶默、估計(jì)所要求的的置信水平為(1-α)時(shí)退唠,統(tǒng)計(jì)量分布兩側(cè)面積各位α/2時(shí)的分位數(shù)值。因此荤胁,總體均值在(1-α)置信水平下的置信區(qū)間可以表達(dá)為:
樣本均值 ±(分位數(shù) * 樣本均值的標(biāo)準(zhǔn)誤)
1、大樣本估計(jì)
由中心極限定理可知屎债,樣本均值近似服從期望值為μ仅政,方差為σ^2/n的正態(tài)分布。樣本均值標(biāo)準(zhǔn)化后得服從標(biāo)準(zhǔn)正態(tài)分布盆驹,z=(x拔-μ)/(σ/開(kāi)方n)~N(0,1)圆丹。
若總體標(biāo)準(zhǔn)差σ已知,標(biāo)準(zhǔn)化時(shí)使用σ躯喇;
若σ未知辫封,則用樣本標(biāo)準(zhǔn)差s代替。
因此廉丽,可以有正態(tài)分布構(gòu)建總體均值在(1-α)置信水平下的置信區(qū)間為:
當(dāng)總體方差未知時(shí)倦微,上述公式的σ替換成s,這是總體均值μ在(1-α)置信水平下的置信區(qū)間為:
install.packages("BSDA","lattice")
library(BSDA,lattice)
library(readr)
oil5<-read.csv("/Users/ayu/Downloads/example5_1.csv",header = T)
# z.test()用于標(biāo)準(zhǔn)正太分布的單樣本和雙樣本的置信區(qū)間和假設(shè)檢驗(yàn)正压。
# y=NULL用于單樣本欣福,sigama.x=sd(數(shù)據(jù)),sigama.y=sd(數(shù)據(jù))用于指定兩個(gè)總體的標(biāo)準(zhǔn)差
# 如果總體標(biāo)準(zhǔn)差未知焦履,使用樣本標(biāo)準(zhǔn)差代替拓劝;
# conf.level用于指定置信水平,如果不給則默認(rèn)是0.95
z.test(oil5$耗油量,y=NULL,sigma.x=sd(oil5$耗油量),conf.level=0.90)
# 只出區(qū)間信息
z.test(oil5$耗油量,y=NULL,sigma.x=sd(oil5$耗油量),conf.level=0.90)$conf.int
#上述代碼輸出結(jié)果
One-sample z-Test # 單一樣本的z檢驗(yàn)
data: oil5$耗油量 #計(jì)算的數(shù)據(jù)對(duì)象和對(duì)象中哪一個(gè)變量
z = 99.575, p-value < 2.2e-16 # Z值=99.575嘉裤,p值小于2.2*10的負(fù)16次方(一般p值小于用戶(hù)定的顯著性水平郑临,就拒絕原假設(shè))
alternative hypothesis: true mean is not equal to 0 #
替代假設(shè):真實(shí)均值不等于0
95 percent confidence interval: # 95%的置信區(qū)間是7.810673到8.124327
7.810673 8.124327
sample estimates: # 樣本估計(jì)的均值是7.9675 ,取了均值置信區(qū)間值的平均數(shù)
mean of x
7.9675
2、小樣本估計(jì)
在小樣本情形下(n<30)屑宠,對(duì)總體均值的估計(jì)都是建立在總體服從正態(tài)分布的假設(shè)前提下厢洞。
-
如果正態(tài)總體的方差已知,樣本經(jīng)過(guò)標(biāo)準(zhǔn)化后仍然服從標(biāo)準(zhǔn)正態(tài)分布此時(shí)可以使用下圖進(jìn)行估計(jì)總體均值的置信區(qū)間:image.png
-
如果正態(tài)總體方差未知,樣本均值經(jīng)過(guò)標(biāo)準(zhǔn)化后服從自由度為n-1的t分布犀变,即:image.png
這時(shí)候妹孙,需要使用t分布構(gòu)建總體均值的置信區(qū)間,在(1-α)置信水平下获枝,總體均值的置信區(qū)間為:
image.png
【例】
計(jì)算某個(gè)隨機(jī)25個(gè)樣本的重量蠢正,假設(shè)25個(gè)重量是服從正態(tài)分布,那么這一批樣本的平均重量在置信水平在95%下的置信區(qū)間是省店?
s1<-read.csv("/Users/ayu/Downloads/example5_2.csv",header = TRUE)
t.test(s1,conf.level = 0.95)
#只輸出區(qū)間信息
t.test(s1)$conf.int
兩個(gè)總體均值之差的估計(jì)
設(shè)有兩個(gè)總體均值μ1嚣崭、μ2。從兩個(gè)總體中分別抽取樣本量為n1懦傍、n2的兩個(gè)隨機(jī)樣本雹舀。均值為x1拔、x2拔粗俱。
估計(jì)兩個(gè)總體均值之差的點(diǎn)估計(jì)量顯然是兩個(gè)樣本的均值之差说榆,也就是(μ1-μ2)=(x1拔-x2拔)
估計(jì)原理與一個(gè)總體均值的區(qū)間估計(jì)類(lèi)似。兩個(gè)總體均值之差在(1-α)的置信水平下的置信區(qū)間可以表示為:
1寸认、獨(dú)立大樣本的估計(jì)
如果兩個(gè)樣本是從兩個(gè)總體中獨(dú)立抽取的签财,即一個(gè)樣本中的元素與另一個(gè)樣本中的元素相互獨(dú)立,這就是獨(dú)立樣本偏塞。
如果兩個(gè)樣本都為大樣本唱蒸,那么兩個(gè)樣本均值之差近似服從期望值為(μ1-μ2)、方差為(σ1^ 2/n1+σ2^ 2/n2)的正態(tài)分布灸叼,兩個(gè)樣本均值之差經(jīng)過(guò)標(biāo)準(zhǔn)化后側(cè)服從標(biāo)準(zhǔn)正態(tài)分布:
-
當(dāng)兩個(gè)總體方差已知時(shí)神汹,兩個(gè)總體均值之差的在置信水平(1-α)下的置信區(qū)間是:
image.png
-
當(dāng)兩個(gè)總體方差未知時(shí),可用兩個(gè)樣本方差來(lái)代替古今,這時(shí)候兩個(gè)總體均值之差在置信水平(1-α)下的置信區(qū)間是:
image.png
【例】
研究男女的工資差異屁魏,選取男女工資各40人的隨機(jī)工資樣本,建立男女平均工資之差的95%置信區(qū)間捉腥。
library(BSDA)
# mu表示原假設(shè)所指定的平均值或平均值差值的單個(gè)數(shù)字
z.test(s2$男性工資,s2$女性工資,mu=0,sigma.x =sd(s2$男性工資) ,sigma.y = sd(s2$女性工資))$conf.int
2蚁堤、獨(dú)立小樣本的估計(jì)
當(dāng)兩個(gè)樣本都是獨(dú)立小樣本時(shí),估計(jì)兩個(gè)總體均值之差需要假設(shè)兩個(gè)總體都服從正態(tài)分布但狭。
- 當(dāng)兩個(gè)總體方差已知時(shí)披诗,兩個(gè)樣本均值之差經(jīng)過(guò)標(biāo)準(zhǔn)化后服從標(biāo)準(zhǔn)正態(tài)分布,此時(shí)可以按照下圖建立兩個(gè)總體均值之差的置信區(qū)間:
-
當(dāng)兩個(gè)總體方差未知時(shí)有以下兩個(gè)場(chǎng)景:
1)兩個(gè)總體方差未知但相等時(shí)立磁,需要用兩個(gè)樣本的方差來(lái)估計(jì)總體方差呈队,此時(shí)需要把兩個(gè)樣本合并到一起,用以得到總體方差西格瑪方的估計(jì)量唱歧,估計(jì)量為下述公式:
image.png
這時(shí)候宪摧,兩個(gè)樣本均值之差經(jīng)過(guò)標(biāo)準(zhǔn)化后服從自由度為(n1-n2-2)的t分布粒竖,也就是下圖的樣子:
image.png
2)當(dāng)兩個(gè)總體的方差未知且不相等時(shí),兩個(gè)樣本均值之差經(jīng)過(guò)標(biāo)準(zhǔn)化后浸塑服從自由度為v的t分布几于,自由度為v的計(jì)算公式為:
image.png
兩個(gè)總體均值之差在在置信水平(1-α)下的置信區(qū)間是:
image.png
【例】
如果有兩組方法進(jìn)行組裝產(chǎn)品蕊苗,分別記錄同樣的12個(gè)工人分別組裝,得到兩個(gè)方法各12個(gè)組裝時(shí)間沿彭。假定組裝時(shí)間都是服從正態(tài)分布的朽砰,計(jì)算:
1)如果兩個(gè)總體方差相等,方法的樣本均值差喉刘,在95%的置信區(qū)間是多少瞧柔?
2)如果兩個(gè)總體方差不等,方法的樣本均值差睦裳,在90%的置信區(qū)間是多少造锅?
ts<-read_csv("/Users/ayu/Downloads/example5_4.csv")
# 假設(shè)方差是相等的,平均時(shí)間差的95%置信區(qū)間
t.test(x=ts$方法一,y=ts$方法二,var.equal = TRUE)$conf.int
# 假設(shè)方差是不等的廉邑,平均時(shí)間差的95%置信區(qū)間
t.test(x=ts$方法一,y=ts$方法二,var.equal = FALSE,conf.level=0.90)$conf.int
3哥蔚、配對(duì)樣本的估計(jì)
用兩個(gè)獨(dú)立樣本估計(jì)兩個(gè)總體均值之差時(shí)有獨(dú)立的弊端,比如偶爾會(huì)將某些不不好的參數(shù)抽樣到一起蛛蒙,這時(shí)候糙箍,兩個(gè)樣本的對(duì)比會(huì)顯得不公平。配對(duì)樣本估計(jì)就是解決這類(lèi)問(wèn)題:也就是一個(gè)樣本中的數(shù)據(jù)與兩一個(gè)樣本中的數(shù)據(jù)相對(duì)應(yīng)宇驾,這樣的數(shù)據(jù)通常是對(duì)同一個(gè)體所做的前后兩次的測(cè)量。比如猴伶,前指定某10個(gè)人用第一種工具組裝產(chǎn)品课舍,再讓這10個(gè)人用第二種工具組裝產(chǎn)品,得到兩種工具組裝產(chǎn)品的總工時(shí)數(shù)據(jù)他挎,這就是配對(duì)數(shù)據(jù)筝尾。
使用配對(duì)樣本進(jìn)行估計(jì)時(shí),在大樣本條件下办桨,兩個(gè)總體均值之差μd=μ1-μ2筹淫,在(1-α)置信水平下的置信區(qū)間為:
其中,d表示兩個(gè)配對(duì)數(shù)據(jù)的差值呢撞,d拔表示個(gè)差值的均值损姜,σd表示各個(gè)差值的標(biāo)準(zhǔn)差,當(dāng)總體σd未知時(shí)殊霞,可用樣本差值sˇd來(lái)替代摧阅。
在小樣本情形下,假定兩個(gè)總體各觀(guān)察值的配對(duì)差服從正態(tài)分布绷蹲,兩個(gè)總體均值之差μd=μ1-μ2棒卷,在(1-α)置信水平下的置信區(qū)間為:
# paired邏輯指示顾孽,表示是否需要配對(duì)t檢驗(yàn)
library(readr)
e5<-read.csv("文件路徑地址",header = TRUE)
t.test(e5$試卷A,e5$試卷B,paired = TRUE)$conf.int
總體比例的區(qū)間估計(jì)
一個(gè)總體比例的估計(jì)
1. 大樣本的估計(jì)方法
#計(jì)算一個(gè)總體比例的置信區(qū)間(大樣本)
#贊成比例的95%的置信區(qū)間
n<-500
x<-325
p<-x/n
q<-qnorm(0.975)
LCI<-p-q*sqrt(p*(1-p)/n)
UCI<-p-q*sqrt(p*(1-p)/n)
data.frame(LCI,UCI)
#使用Hmisc包得到三種不同方法的區(qū)間
install.packages("Hmisc")
library(Hmisc)
n<-500
x<-325
binconf(x,n,alpha=0.05,method="all")
2. 任意大小樣本的估計(jì)方法
#計(jì)算一個(gè)總體比例的置信區(qū)間(任意大小樣本)
#贊成比例的95%的置信區(qū)間
n1<-500+4
p1<-(325+2)/n1
q<-qnorm(0.975)
LCI<-p1-1*sqrt(p1*(1-p1)/n1)
UCI<-p1+1*sqrt(p1*(1-p1)/n1)
data.frame(LCI,UCI)
兩個(gè)總體比例之差的估計(jì)
兩個(gè)總體之差的估計(jì)需要考慮樣本來(lái)那個(gè)的大蝦,如果兩個(gè)樣本量都非常大比规,可以采用傳統(tǒng)的估計(jì)方法若厚,如果兩個(gè)樣本量是中等大小或者比較小,蜒什,需要對(duì)樣本量和實(shí)驗(yàn)成功次數(shù)做出修正以改進(jìn)估計(jì)的區(qū)間测秸。
1. 兩個(gè)大樣本的估計(jì)方法
兩個(gè)總體比例之差的區(qū)間估計(jì)原理與一個(gè)總體比例的區(qū)間估計(jì)相同。
#隨機(jī)調(diào)查500個(gè)女性收看節(jié)目有225人
#隨機(jī)抽查了400個(gè)男性吃谣,收看節(jié)目有128人
#用95%置信水平估計(jì)女性與男性收視率差值的置信區(qū)間乞封。
p1<- 225/500;p2<-128/400
q<-qnorm(0.975)
LCI<-p1-p2-q*sqrt(p1*(1-p1)/500+p2*(1-p2)/400)
UCI<-p1-p2+q*sqrt(p1*(1-p1)/500+p2*(1-p2)/400)
data.frame(LCI,UCI)
2. 兩個(gè)任意大小樣本的估計(jì)方法
#隨機(jī)調(diào)查500個(gè)女性收看節(jié)目有225人
#隨機(jī)抽查了400個(gè)男性,收看節(jié)目有128人
#用95%置信水平估計(jì)女性與男性收視率差值的置信區(qū)間岗憋。
n1<-500+2;n2<-400+2
p1<- (225+1)/n1;p2<-(128+1)/n2
q<-qnorm(0.975)
LCI<-p1-p2-q*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
UCI<-p1-p2+q*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
data.frame(LCI,UCI)
總體方差的區(qū)間估計(jì)
一個(gè)總體方差的估計(jì)
估計(jì)中體方差是肃晚,首先假定總體服從正態(tài)分布,其原理與總體均值和總體比例的區(qū)間估計(jì)不同仔戈,不再是點(diǎn)估計(jì)量±估計(jì)誤差关串。因?yàn)闃颖痉讲畹某闃臃植挤淖杂啥葹椋╪-1)的x^2 分布構(gòu)造總體方差的置信區(qū)間,由于x^2不是對(duì)稱(chēng)分布监徘,無(wú)法由點(diǎn)估計(jì)值±估計(jì)誤差的大總體方差的置信區(qū)間晋修。
install.packages("TeachingDemos")
library(readr,Hmisc,TeachingDemos)
e52<-read.csv("/Users/ayu/Downloads/example5_2.csv",header = TRUE)
sigma.test(e52$食品重量,conf.level=0.95)$conf.int
兩個(gè)總體方差的估計(jì)
比較兩個(gè)總體方差的問(wèn)題,一般由于兩個(gè)樣本店額方差服從了F(n1-1,n2-1)分布凰盔,因此可以用F分布來(lái)構(gòu)造兩個(gè)總體方差比的置信區(qū)間墓卦。
#兩種方法組裝產(chǎn)品得到時(shí)間的兩個(gè)樣本,使用時(shí)間方差比的置信區(qū)間進(jìn)行估計(jì)
library(readr)
e54<-read.csv("/Users/ayu/Downloads/example5_4.csv",header = TRUE)
var.test(e54$方法一,e54$方法二,alternative = "two.sided" )$conf.int