統(tǒng)計(jì)學(xué)第四課:參數(shù)估計(jì)

參數(shù)估計(jì)是在樣本統(tǒng)計(jì)量概率分布的基礎(chǔ)上,根據(jù)樣本信息跳纳,推斷總體參數(shù)忍饰。總體參數(shù)用θ表示寺庄,用于估計(jì)參數(shù)的統(tǒng)計(jì)量用θ上加一個(gè) ^ 表示艾蓝,θ^也稱(chēng)為估計(jì)量,根據(jù)一個(gè)具體的樣本計(jì)算出來(lái)的估計(jì)量的數(shù)值成為估計(jì)值斗塘。

參數(shù)估計(jì)的方法

方法有兩種:點(diǎn)估計(jì)赢织、區(qū)間估計(jì)。

點(diǎn)估計(jì)

點(diǎn)估計(jì)指的是用估計(jì)量的某個(gè)取值馍盟,作為總體參數(shù)θ的估計(jì)值于置。比如用樣本均值作為總體均值的估計(jì)值,用樣本比例作為總體比例的估計(jì)值等等朽合。再比如俱两,某個(gè)產(chǎn)品的樣本良品率是97%,將97%作為這一批產(chǎn)品的良品率曹步。

所以你可以看到宪彩,點(diǎn)估計(jì)的估計(jì)可靠性一般,因?yàn)橐蕾?lài)于估計(jì)量的可靠性讲婚,估計(jì)量的可靠性是有其抽樣分布的標(biāo)準(zhǔn)誤來(lái)衡量的尿孔。這么一來(lái),無(wú)法說(shuō)出點(diǎn)估計(jì)值與總體參數(shù)的真實(shí)值接近程度筹麸,我們就需要找其他的解決辦法活合,比如圍繞估計(jì)值構(gòu)造一個(gè)總體參數(shù)的區(qū)間。

區(qū)間估計(jì)

區(qū)間估計(jì)是在點(diǎn)估計(jì)的基礎(chǔ)上得到總體參數(shù)的一個(gè)估計(jì)區(qū)間物赶,通常區(qū)間是由樣本統(tǒng)計(jì)量±估計(jì)誤差得來(lái)白指。進(jìn)行區(qū)間估計(jì)時(shí),根據(jù)樣本統(tǒng)計(jì)量的抽樣分布酵紫,可以對(duì)統(tǒng)計(jì)量與筒體參數(shù)的接近程度給出一個(gè)概率度量告嘲。

實(shí)際情況,樣本均值已知總體均值未知奖地,我們求的就是總體均值橄唬。可以理解為参歹,總體均值在樣本均值的兩側(cè)對(duì)稱(chēng)分布仰楚,所以我們可以利用標(biāo)準(zhǔn)誤估計(jì)總體均值在多少個(gè)標(biāo)準(zhǔn)誤內(nèi)可以作為總體均值的置信區(qū)間。
置信區(qū)間說(shuō)的就是,在區(qū)間估計(jì)中僧界,由于樣本估計(jì)量構(gòu)造出的總體參數(shù)在一定置信水平下的估計(jì)區(qū)間侨嘀。其中最小值成為區(qū)間下限,最大值成為區(qū)間上限捂襟。我們有哪個(gè)百分?jǐn)?shù)將區(qū)間劃分成100份飒炎,95%稱(chēng)為置信水平(也就是距離樣本均值±1.96個(gè)標(biāo)準(zhǔn)誤的距離),在這個(gè)置信區(qū)間中包含總體參數(shù)真值次數(shù)所占的比例是置信水平笆豁,或成為置信度、置信系數(shù)赤赊。
-置信區(qū)間告訴我們?cè)诙啻喂烙?jì)得到的區(qū)間中,大概有多少個(gè)區(qū)間包含參數(shù)的真值;
-實(shí)際運(yùn)用中過(guò)寬的區(qū)間意義不大偷溺,過(guò)窄區(qū)間容易漏掉真值跨释;
總體參數(shù)真值固定,樣本區(qū)間數(shù)量不固定吹截;

評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)

用于估計(jì)總體參數(shù)的估計(jì)量θ^有很多瘦陈,什么樣的估計(jì)量算比較好的呢?

無(wú)偏性

無(wú)偏性說(shuō)的是:估計(jì)量抽樣分布的期望值=被估計(jì)的總體參數(shù)〔ǘ恚現(xiàn)在有所選估計(jì)量的θ^晨逝, 總體參數(shù)θ,如果E(θ^ )=θ懦铺,則θ^是θ的無(wú)偏估計(jì)量捉貌。

效性

有效性指的是估計(jì)量的方差大小。表示了估計(jì)量接近總體參數(shù)的程度冬念,同一個(gè)總體的無(wú)偏估計(jì)量有非常多個(gè)趁窃,離散最小的則是最好的。

【例】
從均值為0急前、方差為1的總體抽取10000個(gè)樣本量為10的樣本:
1)計(jì)算樣本均值方差和樣本中位數(shù)方差醒陆;
2)進(jìn)行無(wú)偏性和有效性度量模擬;

# 創(chuàng)建向量test裆针,利用R語(yǔ)言解答需要用到循環(huán)語(yǔ)法:
#基本語(yǔ)法
# for (變量 in 條件) {
#    循環(huán)體
# }
test<-c(1,2,5,7,9)
for (i in test) {
  print(i)
}
無(wú)偏估計(jì)的算法:
# vector函數(shù)能創(chuàng)建一個(gè)指定類(lèi)型和長(zhǎng)度的矢量刨摩,比如vector("numeric",2)。
#  rnorm(統(tǒng)計(jì)量, 平均數(shù), 標(biāo)準(zhǔn)差)据块。
# append為給向量添加元素的函數(shù)码邻,append(要添加到哪個(gè)向量上, 要添加的元素是什么, after = length(x)從目標(biāo)向量的第幾個(gè)元素后添加),如果不指定after另假,則從目標(biāo)向量的最后一個(gè)數(shù)字后添加像屋。

# 創(chuàng)造可以制定長(zhǎng)度和類(lèi)型的三個(gè)變量對(duì)象
x<-vector();m<-vector();v<-vector()

# 設(shè)置樣本量為10
n=10

# 變量i按照條件1~10000進(jìn)行循環(huán),每次循環(huán)的數(shù)據(jù)需要滿(mǎn)足統(tǒng)計(jì)量為10边篮、樣本均值為0己莺、標(biāo)準(zhǔn)方差為1 的d數(shù)據(jù)
# 接下來(lái)的每一次循環(huán)所得的數(shù)據(jù)將給x奏甫、m、v分別追加:為x對(duì)象追加d數(shù)據(jù)的均值凌受;為m對(duì)象追加d數(shù)據(jù)的中位數(shù)阵子;為v對(duì)象追加d數(shù)據(jù)的方差。
for (i in 1:10000) {
  d<-rnorm(n,0,1)
  x<-append(x,mean(d))
  m<-append(m,median(d))
  v<-append(v,var(d))
}

# 計(jì)算x胜蛉、m挠进、v各自的平均值,并組合成數(shù)據(jù)框輸出
data.frame(mean(x),mean(m),mean(v))

通過(guò)上面的例子的結(jié)果可以看出:

  • 無(wú)偏估計(jì)中誊册,對(duì)樣本均值领突、樣本方差、樣本中位數(shù)取平均值進(jìn)行比較案怯,結(jié)果都近似于總體均值君旦。總體方差嘲碱、總體中位數(shù)金砍;


有效性的算法:
#接下來(lái)循環(huán)同樣的數(shù)據(jù),但重新命名變量麦锯;
x1<-vector();m1<-vector();v1<-vector()
n=10
for (i in 1:10000) {
  d1<-rnorm(n,0,1)
  x1<-append(x1,mean(d1))
  m1<-append(m1,median(d1))
  v1<-append(v1,var(d1))
}
# 循環(huán)后的樣本計(jì)算他們的方差恕稠,進(jìn)行對(duì)比
data.frame(var(x1),var(m1),var(v1))

通過(guò)上面的例子的結(jié)果可以看出:

  • 檢驗(yàn)有效性時(shí),采用了另一組同樣分布的數(shù)據(jù)變量扶欣,比較樣本均值谱俭、樣本方差、樣本中位數(shù)的方差宵蛀,發(fā)現(xiàn)樣本均值的方差數(shù)字最小昆著,所以是表現(xiàn)更有效的估計(jì)量。

一致性

一致性指的是隨著樣本量無(wú)限增大术陶,統(tǒng)計(jì)量會(huì)最終收斂于所估總體的參數(shù)內(nèi)凑懂。也就是說(shuō),大樣本的估計(jì)量更加接近總體參數(shù)梧宫。

# set.seed生成隨機(jī)數(shù)接谨,括號(hào)里的數(shù)據(jù)代表生成的是第幾次隨機(jī)數(shù)
set.seed(12)

# 變量N是:“樣本量為1000,均值為50塘匣,標(biāo)準(zhǔn)差為10”的一組數(shù)據(jù)
N=rnorm(1000,50,10)
mu=mean(N)

# sample為抽樣函數(shù)脓豪,sample(從什么總體中抽樣,抽樣的次數(shù)忌卤,有無(wú)放回T代表有放回)
x10<-mean(sample(N,10,replace = F))
x100<-mean(sample(N,100,replace = F))
x500<-mean(sample(N,500,replace = F))
x900<-mean(sample(N,900,replace = F))

data.frame(總體均值=mu,x10,x100,x500,x900)

通過(guò)上面的例子的結(jié)果可以看出:

  • 抽樣字?jǐn)?shù)越多扫夜,最終的樣本參數(shù)約接近總體參數(shù)。

總體均值的區(qū)間估計(jì)

研究總體時(shí),推斷總體均值的統(tǒng)計(jì)量就是樣本均值笤闯,研究?jī)蓚€(gè)總體時(shí)堕阔,關(guān)心的參數(shù)是兩個(gè)總體均值的差值,用于推斷的統(tǒng)計(jì)量則是兩個(gè)樣本的均值之差颗味。

一個(gè)總體均值的估計(jì)

在對(duì)一個(gè)總體均值進(jìn)行區(qū)間估計(jì)時(shí)超陆,需要考慮抽取樣本的總體是否是正態(tài)分布、總體方差是否已知浦马、用于估計(jì)的樣本是否為大樣本(n≥30)還是小樣本时呀。
總體均值的置信區(qū)間都是由樣本均值甲減估計(jì)誤差得到的。所以估計(jì)誤差有兩部分組成:點(diǎn)估計(jì)的標(biāo)準(zhǔn)誤晶默、估計(jì)所要求的的置信水平為(1-α)時(shí)退唠,統(tǒng)計(jì)量分布兩側(cè)面積各位α/2時(shí)的分位數(shù)值。因此荤胁,總體均值在(1-α)置信水平下的置信區(qū)間可以表達(dá)為:
樣本均值 ±(分位數(shù) * 樣本均值的標(biāo)準(zhǔn)誤)

1、大樣本估計(jì)

由中心極限定理可知屎债,樣本均值近似服從期望值為μ仅政,方差為σ^2/n的正態(tài)分布。樣本均值標(biāo)準(zhǔn)化后得服從標(biāo)準(zhǔn)正態(tài)分布盆驹,z=(x拔-μ)/(σ/開(kāi)方n)~N(0,1)圆丹。

若總體標(biāo)準(zhǔn)差σ已知,標(biāo)準(zhǔn)化時(shí)使用σ躯喇;
若σ未知辫封,則用樣本標(biāo)準(zhǔn)差s代替。
因此廉丽,可以有正態(tài)分布構(gòu)建總體均值在(1-α)置信水平下的置信區(qū)間為:


image.png

當(dāng)總體方差未知時(shí)倦微,上述公式的σ替換成s,這是總體均值μ在(1-α)置信水平下的置信區(qū)間為:


image.png
install.packages("BSDA","lattice")
library(BSDA,lattice)

library(readr)
oil5<-read.csv("/Users/ayu/Downloads/example5_1.csv",header = T)

# z.test()用于標(biāo)準(zhǔn)正太分布的單樣本和雙樣本的置信區(qū)間和假設(shè)檢驗(yàn)正压。
# y=NULL用于單樣本欣福,sigama.x=sd(數(shù)據(jù)),sigama.y=sd(數(shù)據(jù))用于指定兩個(gè)總體的標(biāo)準(zhǔn)差
# 如果總體標(biāo)準(zhǔn)差未知焦履,使用樣本標(biāo)準(zhǔn)差代替拓劝;
# conf.level用于指定置信水平,如果不給則默認(rèn)是0.95
z.test(oil5$耗油量,y=NULL,sigma.x=sd(oil5$耗油量),conf.level=0.90)

# 只出區(qū)間信息
z.test(oil5$耗油量,y=NULL,sigma.x=sd(oil5$耗油量),conf.level=0.90)$conf.int



#上述代碼輸出結(jié)果

One-sample z-Test   # 單一樣本的z檢驗(yàn)

data:  oil5$耗油量  #計(jì)算的數(shù)據(jù)對(duì)象和對(duì)象中哪一個(gè)變量

z = 99.575, p-value < 2.2e-16 # Z值=99.575嘉裤,p值小于2.2*10的負(fù)16次方(一般p值小于用戶(hù)定的顯著性水平郑临,就拒絕原假設(shè))

alternative hypothesis: true mean is not equal to 0 # 
替代假設(shè):真實(shí)均值不等于0

95 percent confidence interval:  # 95%的置信區(qū)間是7.810673到8.124327
 7.810673 8.124327

sample estimates:  # 樣本估計(jì)的均值是7.9675 ,取了均值置信區(qū)間值的平均數(shù)
mean of x 
   7.9675 
2、小樣本估計(jì)

在小樣本情形下(n<30)屑宠,對(duì)總體均值的估計(jì)都是建立在總體服從正態(tài)分布的假設(shè)前提下厢洞。

  • 如果正態(tài)總體的方差已知,樣本經(jīng)過(guò)標(biāo)準(zhǔn)化后仍然服從標(biāo)準(zhǔn)正態(tài)分布此時(shí)可以使用下圖進(jìn)行估計(jì)總體均值的置信區(qū)間:
    image.png
  • 如果正態(tài)總體方差未知,樣本均值經(jīng)過(guò)標(biāo)準(zhǔn)化后服從自由度為n-1的t分布犀变,即:
    image.png

    這時(shí)候妹孙,需要使用t分布構(gòu)建總體均值的置信區(qū)間,在(1-α)置信水平下获枝,總體均值的置信區(qū)間為:


    image.png

    【例】
    計(jì)算某個(gè)隨機(jī)25個(gè)樣本的重量蠢正,假設(shè)25個(gè)重量是服從正態(tài)分布,那么這一批樣本的平均重量在置信水平在95%下的置信區(qū)間是省店?
 s1<-read.csv("/Users/ayu/Downloads/example5_2.csv",header = TRUE)
 t.test(s1,conf.level = 0.95)

#只輸出區(qū)間信息
t.test(s1)$conf.int


兩個(gè)總體均值之差的估計(jì)

設(shè)有兩個(gè)總體均值μ1嚣崭、μ2。從兩個(gè)總體中分別抽取樣本量為n1懦傍、n2的兩個(gè)隨機(jī)樣本雹舀。均值為x1拔、x2拔粗俱。
估計(jì)兩個(gè)總體均值之差的點(diǎn)估計(jì)量顯然是兩個(gè)樣本的均值之差说榆,也就是(μ1-μ2)=(x1拔-x2拔)
估計(jì)原理與一個(gè)總體均值的區(qū)間估計(jì)類(lèi)似。兩個(gè)總體均值之差在(1-α)的置信水平下的置信區(qū)間可以表示為:


image.png
1寸认、獨(dú)立大樣本的估計(jì)

如果兩個(gè)樣本是從兩個(gè)總體中獨(dú)立抽取的签财,即一個(gè)樣本中的元素與另一個(gè)樣本中的元素相互獨(dú)立,這就是獨(dú)立樣本偏塞。
如果兩個(gè)樣本都為大樣本唱蒸,那么兩個(gè)樣本均值之差近似服從期望值為(μ1-μ2)、方差為(σ1^ 2/n1+σ2^ 2/n2)的正態(tài)分布灸叼,兩個(gè)樣本均值之差經(jīng)過(guò)標(biāo)準(zhǔn)化后側(cè)服從標(biāo)準(zhǔn)正態(tài)分布:

image.png

  • 當(dāng)兩個(gè)總體方差已知時(shí)神汹,兩個(gè)總體均值之差的在置信水平(1-α)下的置信區(qū)間是:


    image.png
  • 當(dāng)兩個(gè)總體方差未知時(shí),可用兩個(gè)樣本方差來(lái)代替古今,這時(shí)候兩個(gè)總體均值之差在置信水平(1-α)下的置信區(qū)間是:


    image.png

【例】
研究男女的工資差異屁魏,選取男女工資各40人的隨機(jī)工資樣本,建立男女平均工資之差的95%置信區(qū)間捉腥。

library(BSDA)
# mu表示原假設(shè)所指定的平均值或平均值差值的單個(gè)數(shù)字
z.test(s2$男性工資,s2$女性工資,mu=0,sigma.x =sd(s2$男性工資) ,sigma.y = sd(s2$女性工資))$conf.int


2蚁堤、獨(dú)立小樣本的估計(jì)

當(dāng)兩個(gè)樣本都是獨(dú)立小樣本時(shí),估計(jì)兩個(gè)總體均值之差需要假設(shè)兩個(gè)總體都服從正態(tài)分布但狭。

  • 當(dāng)兩個(gè)總體方差已知時(shí)披诗,兩個(gè)樣本均值之差經(jīng)過(guò)標(biāo)準(zhǔn)化后服從標(biāo)準(zhǔn)正態(tài)分布,此時(shí)可以按照下圖建立兩個(gè)總體均值之差的置信區(qū)間:
image.png
  • 當(dāng)兩個(gè)總體方差未知時(shí)有以下兩個(gè)場(chǎng)景:
    1)兩個(gè)總體方差未知但相等時(shí)立磁,需要用兩個(gè)樣本的方差來(lái)估計(jì)總體方差呈队,此時(shí)需要把兩個(gè)樣本合并到一起,用以得到總體方差西格瑪方的估計(jì)量唱歧,估計(jì)量為下述公式:


    image.png

    這時(shí)候宪摧,兩個(gè)樣本均值之差經(jīng)過(guò)標(biāo)準(zhǔn)化后服從自由度為(n1-n2-2)的t分布粒竖,也就是下圖的樣子:


    image.png

    2)當(dāng)兩個(gè)總體的方差未知且不相等時(shí),兩個(gè)樣本均值之差經(jīng)過(guò)標(biāo)準(zhǔn)化后浸塑服從自由度為v的t分布几于,自由度為v的計(jì)算公式為:
    image.png

    兩個(gè)總體均值之差在在置信水平(1-α)下的置信區(qū)間是:
    image.png

【例】
如果有兩組方法進(jìn)行組裝產(chǎn)品蕊苗,分別記錄同樣的12個(gè)工人分別組裝,得到兩個(gè)方法各12個(gè)組裝時(shí)間沿彭。假定組裝時(shí)間都是服從正態(tài)分布的朽砰,計(jì)算:
1)如果兩個(gè)總體方差相等,方法的樣本均值差喉刘,在95%的置信區(qū)間是多少瞧柔?
2)如果兩個(gè)總體方差不等,方法的樣本均值差睦裳,在90%的置信區(qū)間是多少造锅?

ts<-read_csv("/Users/ayu/Downloads/example5_4.csv")

# 假設(shè)方差是相等的,平均時(shí)間差的95%置信區(qū)間
t.test(x=ts$方法一,y=ts$方法二,var.equal = TRUE)$conf.int

# 假設(shè)方差是不等的廉邑,平均時(shí)間差的95%置信區(qū)間
t.test(x=ts$方法一,y=ts$方法二,var.equal = FALSE,conf.level=0.90)$conf.int


3哥蔚、配對(duì)樣本的估計(jì)

用兩個(gè)獨(dú)立樣本估計(jì)兩個(gè)總體均值之差時(shí)有獨(dú)立的弊端,比如偶爾會(huì)將某些不不好的參數(shù)抽樣到一起蛛蒙,這時(shí)候糙箍,兩個(gè)樣本的對(duì)比會(huì)顯得不公平。配對(duì)樣本估計(jì)就是解決這類(lèi)問(wèn)題:也就是一個(gè)樣本中的數(shù)據(jù)與兩一個(gè)樣本中的數(shù)據(jù)相對(duì)應(yīng)宇驾,這樣的數(shù)據(jù)通常是對(duì)同一個(gè)體所做的前后兩次的測(cè)量。比如猴伶,前指定某10個(gè)人用第一種工具組裝產(chǎn)品课舍,再讓這10個(gè)人用第二種工具組裝產(chǎn)品,得到兩種工具組裝產(chǎn)品的總工時(shí)數(shù)據(jù)他挎,這就是配對(duì)數(shù)據(jù)筝尾。
使用配對(duì)樣本進(jìn)行估計(jì)時(shí),在大樣本條件下办桨,兩個(gè)總體均值之差μd=μ1-μ2筹淫,在(1-α)置信水平下的置信區(qū)間為:


image.png

其中,d表示兩個(gè)配對(duì)數(shù)據(jù)的差值呢撞,d拔表示個(gè)差值的均值损姜,σd表示各個(gè)差值的標(biāo)準(zhǔn)差,當(dāng)總體σd未知時(shí)殊霞,可用樣本差值sˇd來(lái)替代摧阅。
在小樣本情形下,假定兩個(gè)總體各觀(guān)察值的配對(duì)差服從正態(tài)分布绷蹲,兩個(gè)總體均值之差μd=μ1-μ2棒卷,在(1-α)置信水平下的置信區(qū)間為:


image.png
# paired邏輯指示顾孽,表示是否需要配對(duì)t檢驗(yàn)
library(readr)
e5<-read.csv("文件路徑地址",header = TRUE)
t.test(e5$試卷A,e5$試卷B,paired = TRUE)$conf.int

總體比例的區(qū)間估計(jì)

一個(gè)總體比例的估計(jì)

1. 大樣本的估計(jì)方法
#計(jì)算一個(gè)總體比例的置信區(qū)間(大樣本)

#贊成比例的95%的置信區(qū)間
n<-500
x<-325
p<-x/n
q<-qnorm(0.975)
LCI<-p-q*sqrt(p*(1-p)/n)
UCI<-p-q*sqrt(p*(1-p)/n)
data.frame(LCI,UCI)

#使用Hmisc包得到三種不同方法的區(qū)間
install.packages("Hmisc")
library(Hmisc)
n<-500
x<-325
binconf(x,n,alpha=0.05,method="all")
2. 任意大小樣本的估計(jì)方法
#計(jì)算一個(gè)總體比例的置信區(qū)間(任意大小樣本)

#贊成比例的95%的置信區(qū)間
n1<-500+4
p1<-(325+2)/n1
q<-qnorm(0.975)
LCI<-p1-1*sqrt(p1*(1-p1)/n1)
UCI<-p1+1*sqrt(p1*(1-p1)/n1)
data.frame(LCI,UCI)

兩個(gè)總體比例之差的估計(jì)

兩個(gè)總體之差的估計(jì)需要考慮樣本來(lái)那個(gè)的大蝦,如果兩個(gè)樣本量都非常大比规,可以采用傳統(tǒng)的估計(jì)方法若厚,如果兩個(gè)樣本量是中等大小或者比較小,蜒什,需要對(duì)樣本量和實(shí)驗(yàn)成功次數(shù)做出修正以改進(jìn)估計(jì)的區(qū)間测秸。

1. 兩個(gè)大樣本的估計(jì)方法

兩個(gè)總體比例之差的區(qū)間估計(jì)原理與一個(gè)總體比例的區(qū)間估計(jì)相同。

#隨機(jī)調(diào)查500個(gè)女性收看節(jié)目有225人
#隨機(jī)抽查了400個(gè)男性吃谣,收看節(jié)目有128人
#用95%置信水平估計(jì)女性與男性收視率差值的置信區(qū)間乞封。
p1<- 225/500;p2<-128/400
q<-qnorm(0.975)
LCI<-p1-p2-q*sqrt(p1*(1-p1)/500+p2*(1-p2)/400)
UCI<-p1-p2+q*sqrt(p1*(1-p1)/500+p2*(1-p2)/400)
data.frame(LCI,UCI)
2. 兩個(gè)任意大小樣本的估計(jì)方法
#隨機(jī)調(diào)查500個(gè)女性收看節(jié)目有225人
#隨機(jī)抽查了400個(gè)男性,收看節(jié)目有128人
#用95%置信水平估計(jì)女性與男性收視率差值的置信區(qū)間岗憋。
n1<-500+2;n2<-400+2
p1<- (225+1)/n1;p2<-(128+1)/n2
q<-qnorm(0.975)
LCI<-p1-p2-q*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
UCI<-p1-p2+q*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
data.frame(LCI,UCI)

總體方差的區(qū)間估計(jì)

一個(gè)總體方差的估計(jì)

估計(jì)中體方差是肃晚,首先假定總體服從正態(tài)分布,其原理與總體均值和總體比例的區(qū)間估計(jì)不同仔戈,不再是點(diǎn)估計(jì)量±估計(jì)誤差关串。因?yàn)闃颖痉讲畹某闃臃植挤淖杂啥葹椋╪-1)的x^2 分布構(gòu)造總體方差的置信區(qū)間,由于x^2不是對(duì)稱(chēng)分布监徘,無(wú)法由點(diǎn)估計(jì)值±估計(jì)誤差的大總體方差的置信區(qū)間晋修。

install.packages("TeachingDemos")
library(readr,Hmisc,TeachingDemos)
e52<-read.csv("/Users/ayu/Downloads/example5_2.csv",header = TRUE)
sigma.test(e52$食品重量,conf.level=0.95)$conf.int

兩個(gè)總體方差的估計(jì)

比較兩個(gè)總體方差的問(wèn)題,一般由于兩個(gè)樣本店額方差服從了F(n1-1,n2-1)分布凰盔,因此可以用F分布來(lái)構(gòu)造兩個(gè)總體方差比的置信區(qū)間墓卦。

#兩種方法組裝產(chǎn)品得到時(shí)間的兩個(gè)樣本,使用時(shí)間方差比的置信區(qū)間進(jìn)行估計(jì)
library(readr)
e54<-read.csv("/Users/ayu/Downloads/example5_4.csv",header = TRUE)
var.test(e54$方法一,e54$方法二,alternative = "two.sided" )$conf.int

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末户敬,一起剝皮案震驚了整個(gè)濱河市落剪,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌尿庐,老刑警劉巖忠怖,帶你破解...
    沈念sama閱讀 219,490評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異抄瑟,居然都是意外死亡凡泣,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)皮假,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)鞋拟,“玉大人,你說(shuō)我怎么就攤上這事惹资⊙下簦” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,830評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵布轿,是天一觀(guān)的道長(zhǎng)哮笆。 經(jīng)常有香客問(wèn)我来颤,道長(zhǎng),這世上最難降的妖魔是什么稠肘? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,957評(píng)論 1 295
  • 正文 為了忘掉前任福铅,我火速辦了婚禮,結(jié)果婚禮上项阴,老公的妹妹穿的比我還像新娘滑黔。我一直安慰自己,他們只是感情好环揽,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,974評(píng)論 6 393
  • 文/花漫 我一把揭開(kāi)白布略荡。 她就那樣靜靜地躺著,像睡著了一般歉胶。 火紅的嫁衣襯著肌膚如雪汛兜。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,754評(píng)論 1 307
  • 那天通今,我揣著相機(jī)與錄音粥谬,去河邊找鬼。 笑死辫塌,一個(gè)胖子當(dāng)著我的面吹牛漏策,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播臼氨,決...
    沈念sama閱讀 40,464評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼掺喻,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了储矩?” 一聲冷哼從身側(cè)響起感耙,我...
    開(kāi)封第一講書(shū)人閱讀 39,357評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎椰苟,沒(méi)想到半個(gè)月后抑月,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體树叽,經(jīng)...
    沈念sama閱讀 45,847評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡舆蝴,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,995評(píng)論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了题诵。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片洁仗。...
    茶點(diǎn)故事閱讀 40,137評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖性锭,靈堂內(nèi)的尸體忽然破棺而出赠潦,到底是詐尸還是另有隱情,我是刑警寧澤草冈,帶...
    沈念sama閱讀 35,819評(píng)論 5 346
  • 正文 年R本政府宣布她奥,位于F島的核電站瓮增,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏哩俭。R本人自食惡果不足惜绷跑,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,482評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望凡资。 院中可真熱鬧砸捏,春花似錦、人聲如沸隙赁。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,023評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)伞访。三九已至掂骏,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間咐扭,已是汗流浹背芭挽。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,149評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蝗肪,地道東北人袜爪。 一個(gè)月前我還...
    沈念sama閱讀 48,409評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像薛闪,于是被迫代替她去往敵國(guó)和親辛馆。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,086評(píng)論 2 355