商務(wù)與經(jīng)濟統(tǒng)計——抽樣分布與區(qū)間估計

1. 基礎(chǔ)概念及其定義

1.1 簡單隨機樣本(有限總體)

從容量為 N 的有限總體中抽取一個容量為n的樣本,如果容量為 n 的每一個可能的樣本都以相等的概率被抽出寺滚,則稱該樣本為簡單隨機樣本。

1.2 隨機樣本(無限總體)

如果從一個無限總體中抽取一個容量為 n 的樣本哗戈,使得下面的條件得到滿足:

  1. 抽取的每個個體來自同一總體
  2. 每個個體的抽取是獨立的
    則稱該樣本是一個隨機樣本

1.3 抽樣分布

一個樣本統(tǒng)計量所有可能值構(gòu)成的概率分布

1.4 無偏性

點估計量的一個性質(zhì)洪唐,此時點估計量的數(shù)學(xué)期望等于所估總體參數(shù)的值

1.5 中心極限定理

從總體中抽取容量為 n 的簡單隨機樣本淆党,當樣本容量很大時,樣本均值 \bar{x} 的抽樣分布近似服從正態(tài)概率分布珠闰。一般來說惜浅,當樣本容量大于或者等于 30 時, \bar{x} 的抽樣分布可用正態(tài)分布近似伏嗜。

1.6 抽樣方法

  • 分層隨機抽樣:先將總體分成若干層坛悉,然后在每層中進行簡單隨機抽樣。依賴于層內(nèi)個體的同質(zhì)性承绸。
  • 整群抽樣:先將總體分成若干群裸影,然后以群為單位進行簡單隨機抽樣。依賴于每一群對整個總體的代表性军熏。

1.7 區(qū)間估計

總體參數(shù)估計值的一個區(qū)間轩猩,確信該區(qū)間將參數(shù)值納入其中。通常是在點估計上加減一個邊際誤差的值來計算區(qū)間估計荡澎。區(qū)間估計的目的在于均践,提供基于樣本得出的點估計值與總體參數(shù)值的接近程度方面的信息。

2. 抽樣分布

2.1 \bar{x} 的抽樣分布

樣本均值 \bar{x} 的所有可能值的概率分布摩幔⊥可用于提供樣本均值 \bar{x} 與總體均值 \mu 的接近程度的概率信息。

  • 數(shù)學(xué)期望
    E(\bar{x}) = \mu
    其中或衡,\mu 為總體均值
  • 標準(誤)差
    \sigma_{\bar{x}} = \sqrt{\frac{N-n}{N-1}}\left ( \frac{\sigma }{\sqrt{n}} \right ) \quad 有限總體
    \sigma_{\bar{x}} = \frac{\sigma }{\sqrt{n}} \quad 無限總體
    n/N \leqslant 0.05 時焦影,采用無限總體的計算公式车遂。樣本容量越大,樣本均值落在總體均值附近某一特定范圍內(nèi)的概率也越大偷办。
  • \bar{x} 抽樣分布的形態(tài)
  • 當總體服從正態(tài)分布時艰额,在任何樣本容量下 \bar{x} 的抽樣分布都是正態(tài)分布
  • 當總體不服從正態(tài)分布時澄港,根據(jù)中心極限定理來判定椒涯。

2.2 \bar{p} 的抽樣分布

樣本比率 \bar{p} 是總體比率 p 的點估計,樣本比率的計算公式為
\bar{p} = \frac{x}{n}
其中回梧,x 為樣本中具有感興趣特征的個體的數(shù)量废岂,n 代表樣本容量。

\bar{p} 的抽樣分布是樣本比率\bar{p} 的所有可能值的概率分布狱意。它可以對樣本比率與總體比率的差異程度提供概率信息湖苞。

  • 數(shù)學(xué)期望
    E(\bar{p}) = p
  • 標準(誤)差
    \sigma_{\bar{p}} = \sqrt{\frac{N-n}{N-1}}\sqrt{\frac{p(1-p)}{n}} \quad 有限總體
    \sigma_{\bar{p}} = \sqrt{\frac{p(1-p)}{n}} \quad 無限總體
    n/N \leqslant 0.05 時,采用無限總體的計算公式详囤。
  • \bar{p} 抽樣分布的形態(tài)
  • np \geqslant5 并且 n(1-p) \geqslant 5時财骨,\bar{p} 的抽樣分布可以用正態(tài)分布近似。

2.3 r_s 的抽樣分布

r_s 為樣本秩相關(guān)系數(shù)藏姐,其計算公式為:
r_s = 1 - \frac{6\sum_{i=1}^{n}d_i^2}{n(n^2-1)}
其中隆箩,n 為樣本中觀測值的個數(shù);x_i 為對于第 1 個變量的第 i 觀測值的秩羔杨;y_i 為對于第 2 個變量的第 i 觀測值的秩捌臊;d_i = x_i - y_i

r_s 的抽樣分布

  • 均值:
    \mu_{r_s} = 0
  • 標準差:
    \sigma_{r_s} = \sqrt{\frac{1}{n-1}}
  • 分布形式
    n \geqslant 10 時兜材,近似服從正態(tài)分布理澎。

3. 總體均值的區(qū)間估計

一個點估計量 \pm 邊際誤差。其中曙寡,邊際誤差 = 標準誤差乘以z_{\alpha /2}糠爬。

3.1 \sigma 已知的情形

\bar{x} \pm z_{\alpha /2}\frac{\sigma }{\sqrt{n}} \tag{1}
其中,1-\alpha 為置信系數(shù)举庶,z_{\alpha /2} 表示標準正態(tài)概率分布上側(cè)面積為 \alpha /2 時的 z 值执隧。

常用的置信水平下的 \alpha /2 值:

置信水平 \alpha z_{\alpha} \alpha /2 z_{\alpha /2}
90% 0.1 1.28 0.05 1.645
95% 0.05 1.645 0.025 1.960
99% 0.01 2.33 0.005 2.576

應(yīng)用中需要注意若總體服從正態(tài)分布,則 (1) 給出的置信區(qū)間是精確的灯变;若總體不屬于正態(tài)分布罩缴,則需要樣本容量足夠(一般 n \geqslant 30 已足夠卒蘸,若總體分布大致對稱,則樣本容量至少為 15 才能得到置信區(qū)間一個好的近似。)

3.2 \sigma 未知的情形

3.2.1 t 分布

一類概率分布挟冠,當總體標準差 \sigma 未知而用樣本標準差 s 對其進行估計時,該分布用于建立總體均值的區(qū)間估計弄慰。隨著自由度的增大,t 分布與標準正態(tài)分布越來越相似署尤。t 分布用于計算總體均值的區(qū)間估計,其自由度為 n-1亚侠,其中 n 是樣本容量曹体。

3.2.1 總體均值的區(qū)間估計

\bar{x} \pm t_{\alpha /2}\frac{s }{\sqrt{n}} \tag{2}
其中,s 為樣本標準差硝烂,1-\alpha 為置信系數(shù)箕别,t_{\alpha /2} 表示自由度為 n-1t 的分布中,上側(cè)面積為 \alpha /2 時的 t 值滞谢。

應(yīng)用中需要注意若總體服從正態(tài)分布串稀,則 (2) 給出的置信區(qū)間是精確的;若總體不屬于正態(tài)分布狮杨,則需要樣本容量足夠(一般 n \geqslant 30 已足夠母截,若總體分布大致對稱,則樣本容量至少為 15 才能得到置信區(qū)間一個好的近似橄教;若總體的分布是嚴重偏斜或者包含異常點時清寇,需要樣本容量 \geqslant 50。)

3.3 樣本容量的確定

n = \frac{(z_{\alpha /2})^2\cdot \sigma^2}{E^2}
其中护蝶, E 為希望達到的邊際誤差华烟。若總體標準差 \sigma 是未知的,一般可以將 極差 /4 做為標準差 \sigma 的粗略估計滓走。

4. 總體比率的區(qū)間估計

3.4.1 區(qū)間估計

\bar{p} \pm z_{\alpha /2}\sqrt{\frac{\bar{p}(1-\bar{p})}{n}}
其中垦江,1-\alpha 為置信系數(shù),z_{\alpha /2} 表示標準正態(tài)概率分布上側(cè)面積為 \alpha /2 時的 z 值搅方。

3.4.2 樣本容量

n = \frac{(z_{\alpha /2})^2 p^*(1-p^*)}{E^2}
其中比吭,p^* 表示 \bar{p} 的計劃值, E 為希望達到的邊際誤差姨涡。

5. 兩總體均值之差的區(qū)間估計

兩總體均值之差的點估計量為 \bar{x_1} - \bar{x_2}

5.1 \sigma_1\sigma_2 已知的情形

  • \bar{x_1} - \bar{x_2} 的標準誤差
    \sigma_{\bar{x_1} - \bar{x_2}} = \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}

  • \bar{x_1} - \bar{x_2} 的區(qū)間估計
    \bar{x_1} - \bar{x_2} \pm z_{\alpha /2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}
    其中衩藤,1-\alpha 為置信系數(shù)。

5.2 \sigma_1\sigma_2 未知的情形

  • \bar{x_1} - \bar{x_2} 的標準誤差
    \sigma_{\bar{x_1} - \bar{x_2}} = \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}

  • \bar{x_1} - \bar{x_2} 的區(qū)間估計
    \bar{x_1} - \bar{x_2} \pm t_{\alpha /2} \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}
    其中涛漂,1-\alpha 為置信系數(shù)赏表;t 統(tǒng)計量的自由度采用如下計算公式
    df = \frac{\left ( \frac{s_1^2}{n_1}+ \frac{s_2^2}{n_2}\right )^2}{\frac{1}{n_1 - 1}\left ( \frac{s_1^2}{n_1} \right )^2 + \frac{1}{n_2 - 1}\left ( \frac{s_2^2}{n_2} \right )^2}

5.3 匹配樣本

  • 區(qū)間估計
    \barphb7txb\pm t_{\alpha /2}\frac{s_d}{\sqrt{n}}
    其中,\bartzxl7rr 為樣本差值的均值匈仗,s_d 為樣本標準差瓢剿,t 分布的自由度為 n-1

6. 兩總體比例之差的區(qū)間估計

兩總體比例之差的點估計量為 \bar{p_1} - \bar{p_2}

  • \bar{p_1} - \bar{p_2} 的標準誤差
    \sigma_{\bar{p_1} - \bar{p_2}} = \sqrt{\frac{p_1(1-p_1)}{n_1} + \frac{p_2(1-p_2)}{n_2}}

  • \bar{p_1} - \bar{p_2} 的區(qū)間估計
    \bar{p_1} - \bar{p_2} \pm z_{\alpha /2} \sqrt{\frac{\bar{p_1}(1-\bar{p_1})}{n_1} + \frac{\bar{p_2}(1-\bar{p_2})}{n_2}}
    其中悠轩,1-\alpha 為置信系數(shù)间狂;兩總體比例未知時,用 \bar{p_1} ,\bar{p_2}來估計 p_1, p_2火架。

7. 一個總體方差的統(tǒng)計推斷

  • 從正態(tài)總體中任一抽取一個容量為 n 的簡單隨機樣本鉴象,則
    \frac{(n-1)s^2}{\sigma^2}
    的抽樣分布服從自由度為 n-1\chi^2 分布忙菠。

  • 一個總體方差的區(qū)間估計
    \frac{(n-1)s^2}{\chi^2_{\alpha /2}} \leqslant \sigma^2 \leqslant \frac{(n-1)s^2}{\chi^2_{1-\alpha /2}}
    其中,\chi^2_{\alpha} 表示 \chi^2 分布右側(cè)的面積或概率為 \alpha 時對應(yīng)的 \chi^2 值纺弊,\chi^2 分布的自由度為n-1牛欢,n 為樣本容量。

8. 兩個總體方差的統(tǒng)計推斷

  • 從兩個方差相等的正態(tài)總體中分別抽取容量為 n_1n_2 的兩個獨立的簡單隨機樣本淆游,則 \frac{s_1^2}{s_2^2}的抽樣分布服從分子自由度為 n_1-1 和分布自由度為 n_2-1F 分布傍睹。s_1^2 為取自總體 1 的容量為 n_1 的隨機樣本的樣本方差,s_2^2 為取自總體 2 的容量為 n_2 的隨機樣本的樣本方差稽犁。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末焰望,一起剝皮案震驚了整個濱河市骚亿,隨后出現(xiàn)的幾起案子已亥,更是在濱河造成了極大的恐慌,老刑警劉巖来屠,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件虑椎,死亡現(xiàn)場離奇詭異,居然都是意外死亡俱笛,警方通過查閱死者的電腦和手機捆姜,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來迎膜,“玉大人泥技,你說我怎么就攤上這事】慕觯” “怎么了珊豹?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長榕订。 經(jīng)常有香客問我店茶,道長,這世上最難降的妖魔是什么劫恒? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任贩幻,我火速辦了婚禮,結(jié)果婚禮上两嘴,老公的妹妹穿的比我還像新娘丛楚。我一直安慰自己,他們只是感情好憔辫,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布趣些。 她就那樣靜靜地躺著,像睡著了一般螺垢。 火紅的嫁衣襯著肌膚如雪喧务。 梳的紋絲不亂的頭發(fā)上赖歌,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天,我揣著相機與錄音功茴,去河邊找鬼庐冯。 笑死,一個胖子當著我的面吹牛坎穿,可吹牛的內(nèi)容都是我干的展父。 我是一名探鬼主播,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼玲昧,長吁一口氣:“原來是場噩夢啊……” “哼栖茉!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起孵延,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤吕漂,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后尘应,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體惶凝,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年犬钢,在試婚紗的時候發(fā)現(xiàn)自己被綠了苍鲜。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡玷犹,死狀恐怖混滔,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情歹颓,我是刑警寧澤坯屿,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站晴股,受9級特大地震影響愿伴,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜电湘,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一隔节、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧寂呛,春花似錦怎诫、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至劫拢,卻和暖如春肉津,著一層夾襖步出監(jiān)牢的瞬間强胰,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工妹沙, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留偶洋,地道東北人。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓距糖,卻偏偏與公主長得像玄窝,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子悍引,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容