1. 基礎(chǔ)概念及其定義
1.1 簡單隨機樣本(有限總體)
從容量為 的有限總體中抽取一個容量為n的樣本,如果容量為 的每一個可能的樣本都以相等的概率被抽出寺滚,則稱該樣本為簡單隨機樣本。
1.2 隨機樣本(無限總體)
如果從一個無限總體中抽取一個容量為 的樣本哗戈,使得下面的條件得到滿足:
- 抽取的每個個體來自同一總體
- 每個個體的抽取是獨立的
則稱該樣本是一個隨機樣本
1.3 抽樣分布
一個樣本統(tǒng)計量所有可能值構(gòu)成的概率分布
1.4 無偏性
點估計量的一個性質(zhì)洪唐,此時點估計量的數(shù)學(xué)期望等于所估總體參數(shù)的值
1.5 中心極限定理
從總體中抽取容量為 的簡單隨機樣本淆党,當樣本容量很大時,樣本均值 的抽樣分布近似服從正態(tài)概率分布珠闰。一般來說惜浅,當樣本容量大于或者等于 時, 的抽樣分布可用正態(tài)分布近似伏嗜。
1.6 抽樣方法
- 分層隨機抽樣:先將總體分成若干層坛悉,然后在每層中進行簡單隨機抽樣。依賴于層內(nèi)個體的同質(zhì)性承绸。
- 整群抽樣:先將總體分成若干群裸影,然后以群為單位進行簡單隨機抽樣。依賴于每一群對整個總體的代表性军熏。
1.7 區(qū)間估計
總體參數(shù)估計值的一個區(qū)間轩猩,確信該區(qū)間將參數(shù)值納入其中。通常是在點估計上加減一個邊際誤差的值來計算區(qū)間估計荡澎。區(qū)間估計的目的在于均践,提供基于樣本得出的點估計值與總體參數(shù)值的接近程度方面的信息。
2. 抽樣分布
2.1 的抽樣分布
樣本均值 的所有可能值的概率分布摩幔⊥可用于提供樣本均值 與總體均值 的接近程度的概率信息。
- 數(shù)學(xué)期望
其中或衡, 為總體均值 - 標準(誤)差
當 時焦影,采用無限總體的計算公式车遂。樣本容量越大,樣本均值落在總體均值附近某一特定范圍內(nèi)的概率也越大偷办。 - 抽樣分布的形態(tài)
- 當總體服從正態(tài)分布時艰额,在任何樣本容量下 的抽樣分布都是正態(tài)分布
- 當總體不服從正態(tài)分布時澄港,根據(jù)中心極限定理來判定椒涯。
2.2 的抽樣分布
樣本比率 是總體比率 的點估計,樣本比率的計算公式為
其中回梧, 為樣本中具有感興趣特征的個體的數(shù)量废岂, 代表樣本容量。
的抽樣分布是樣本比率 的所有可能值的概率分布狱意。它可以對樣本比率與總體比率的差異程度提供概率信息湖苞。
- 數(shù)學(xué)期望
- 標準(誤)差
當 時,采用無限總體的計算公式详囤。 - 抽樣分布的形態(tài)
- 當 并且 時财骨, 的抽樣分布可以用正態(tài)分布近似。
2.3 的抽樣分布
為樣本秩相關(guān)系數(shù)藏姐,其計算公式為:
其中隆箩, 為樣本中觀測值的個數(shù); 為對于第 個變量的第 觀測值的秩羔杨; 為對于第 個變量的第 觀測值的秩捌臊;。
的抽樣分布
- 均值:
- 標準差:
- 分布形式
時兜材,近似服從正態(tài)分布理澎。
3. 總體均值的區(qū)間估計
一個點估計量 邊際誤差。其中曙寡,邊際誤差 = 標準誤差乘以糠爬。
3.1 已知的情形
其中, 為置信系數(shù)举庶, 表示標準正態(tài)概率分布上側(cè)面積為 時的 值执隧。
常用的置信水平下的 值:
置信水平 | ||||
---|---|---|---|---|
90% | 0.1 | 1.28 | 0.05 | 1.645 |
95% | 0.05 | 1.645 | 0.025 | 1.960 |
99% | 0.01 | 2.33 | 0.005 | 2.576 |
應(yīng)用中需要注意若總體服從正態(tài)分布,則 給出的置信區(qū)間是精確的灯变;若總體不屬于正態(tài)分布罩缴,則需要樣本容量足夠(一般 已足夠卒蘸,若總體分布大致對稱,則樣本容量至少為 才能得到置信區(qū)間一個好的近似。)
3.2 未知的情形
3.2.1 分布
一類概率分布挟冠,當總體標準差 未知而用樣本標準差 對其進行估計時,該分布用于建立總體均值的區(qū)間估計弄慰。隨著自由度的增大, 分布與標準正態(tài)分布越來越相似署尤。 分布用于計算總體均值的區(qū)間估計,其自由度為 亚侠,其中 是樣本容量曹体。
3.2.1 總體均值的區(qū)間估計
其中, 為樣本標準差硝烂, 為置信系數(shù)箕别, 表示自由度為 的 的分布中,上側(cè)面積為 時的 值滞谢。
應(yīng)用中需要注意若總體服從正態(tài)分布串稀,則 給出的置信區(qū)間是精確的;若總體不屬于正態(tài)分布狮杨,則需要樣本容量足夠(一般 已足夠母截,若總體分布大致對稱,則樣本容量至少為 才能得到置信區(qū)間一個好的近似橄教;若總體的分布是嚴重偏斜或者包含異常點時清寇,需要樣本容量 。)
3.3 樣本容量的確定
其中护蝶, 為希望達到的邊際誤差华烟。若總體標準差 是未知的,一般可以將 做為標準差 的粗略估計滓走。
4. 總體比率的區(qū)間估計
3.4.1 區(qū)間估計
其中垦江, 為置信系數(shù), 表示標準正態(tài)概率分布上側(cè)面積為 時的 值搅方。
3.4.2 樣本容量
其中比吭, 表示 的計劃值, 為希望達到的邊際誤差姨涡。
5. 兩總體均值之差的區(qū)間估計
兩總體均值之差的點估計量為
5.1 和 已知的情形
的標準誤差
的區(qū)間估計
其中衩藤, 為置信系數(shù)。
5.2 和 未知的情形
的標準誤差
的區(qū)間估計
其中涛漂, 為置信系數(shù)赏表; 統(tǒng)計量的自由度采用如下計算公式
5.3 匹配樣本
- 區(qū)間估計
其中, 為樣本差值的均值匈仗, 為樣本標準差瓢剿, 分布的自由度為 。
6. 兩總體比例之差的區(qū)間估計
兩總體比例之差的點估計量為
的標準誤差
的區(qū)間估計
其中悠轩, 為置信系數(shù)间狂;兩總體比例未知時,用 來估計 火架。
7. 一個總體方差的統(tǒng)計推斷
從正態(tài)總體中任一抽取一個容量為 的簡單隨機樣本鉴象,則
的抽樣分布服從自由度為 的 分布忙菠。一個總體方差的區(qū)間估計
其中, 表示 分布右側(cè)的面積或概率為 時對應(yīng)的 值纺弊, 分布的自由度為牛欢, 為樣本容量。
8. 兩個總體方差的統(tǒng)計推斷
- 從兩個方差相等的正態(tài)總體中分別抽取容量為 和 的兩個獨立的簡單隨機樣本淆游,則 的抽樣分布服從分子自由度為 和分布自由度為 的 分布傍睹。 為取自總體 的容量為 的隨機樣本的樣本方差, 為取自總體 的容量為 的隨機樣本的樣本方差稽犁。