第十二章 多個(gè)比率的比較幻梯、獨(dú)立性及擬合優(yōu)度檢驗(yàn)

參考書(shū)目為安德森的《商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)》,以下為個(gè)人的學(xué)習(xí)總結(jié)努释,如果有錯(cuò)誤歡迎指正碘梢。有需要本書(shū)pdf的,鏈接在本文末尾伐蒂。(僅限個(gè)人學(xué)習(xí)使用煞躬,請(qǐng)勿牟利)

第十二章 多個(gè)比率的比較、獨(dú)立性及擬合優(yōu)度檢驗(yàn)

前面介紹了一個(gè)或兩個(gè)總體的總體均值饿自、比率和方差的假設(shè)檢驗(yàn)的統(tǒng)計(jì)推斷汰翠。接下來(lái)介紹另外三種假設(shè)檢驗(yàn)的方法龄坪。幫助我們對(duì)總體進(jìn)行統(tǒng)計(jì)推斷。

12.1 三個(gè)或多個(gè)總體比率的相等性的檢驗(yàn)

針對(duì)多個(gè)總體比率p_1复唤、p_2健田、p_3\cdots p_k
假設(shè):H_0:p_1=p_2=\cdots=p_k H_a:所有總體比率不全相等
如果根據(jù)樣本數(shù)據(jù)和\chi^2檢驗(yàn)計(jì)算結(jié)果表明不能拒絕H_0則我們認(rèn)為k個(gè)總體比率有差異。

舉例:調(diào)查不同汽車的汽車品牌忠誠(chéng)度(再次購(gòu)買的比率)佛纫。

  • 假設(shè):H_0:p_1=p_2=p_3 H_a:所有總體比率不全相等
  • 已知:n_1=125 n_2=200 n_3=175
image

另外在500人有312人對(duì)自己的品牌有忠誠(chéng)度妓局,312/500=0.624;那么我們可以算出每個(gè)汽車車主還會(huì)再次購(gòu)買該品牌的期望頻數(shù)呈宇,即0.624n_i好爬,從而得到下面的表。

image

檢驗(yàn)統(tǒng)計(jì)量\chi^2
\chi^2=\sum\limits_{i} \sum\limits_{j} \frac{(f_{ij}-e_{ij})^2}{e_{ij}}
式子中甥啄,f_{ij}為第i行第j列的單元格的觀察頻數(shù)存炮;e_{ij}代表在假定H_0為真時(shí)的第i行和第j列的單元格的期望頻數(shù)。
涉及k個(gè)總體比率相等性的\chi^2檢驗(yàn)中蜈漓,上述檢驗(yàn)統(tǒng)計(jì)量服從自由度為k-1的\chi^2分布穆桂,并且要求每個(gè)e_{ij}都大于等于5。

根據(jù)公式融虽,我們進(jìn)行計(jì)算享完,如下圖所示。得到\chi^2=7.89

image

由于我們假定的時(shí)H_0:p_1=p_2=p_3有额,所以觀察頻數(shù)f_{ij}與期望頻數(shù)e_{ij}應(yīng)該是一致的般又,那么在檢驗(yàn)統(tǒng)計(jì)量\chi^2計(jì)算中(f_{ij}-e_{ij})^2應(yīng)該較小,且此時(shí)H_0不能被拒絕巍佑;另一方面茴迁,如果(f_{ij}-e_{ij})^2較大,則H_0可能會(huì)被拒絕句狼。所以說(shuō)總體比率相等性的\chi^2檢驗(yàn)永遠(yuǎn)是一個(gè)上側(cè)檢驗(yàn)笋熬。

通過(guò)excel的計(jì)算,我們知道當(dāng)\chi^2=7.89腻菇,自由度為2時(shí)的上側(cè)面積即p-值=0.0194<0.05胳螟,所以我們拒絕H_0認(rèn)為三車的車主品牌忠誠(chéng)度不完全相同。

當(dāng)然也可以用臨界值法:對(duì)于\alpha=0.05筹吐,自由度為2的檢驗(yàn)統(tǒng)計(jì)量的臨界值\chi^2=5.9915糖耸,如果\chi^2>5.9915則拒絕H_0

總結(jié):對(duì)于k \geq 3個(gè)總體,總體比率相等性的\chi^2檢驗(yàn)的一般步驟如下:

image

多重比較方法

  1. 首先丘薛,我們?nèi)∶恳粚?duì)總體的樣本比率之差的絕對(duì)值嘉竟。即|\bar p_1-\bar p_2||\bar p_1-\bar p_3||\bar p_2-\bar p_3|
  2. k個(gè)總體比率的Marascuilo成對(duì)比較方法臨界值:
    CV_{ij}=\sqrt{\chi_{\alpha}^2}\sqrt{\frac{\bar p_i(1-\bar p_i)}{n_i}+\frac{\bar p_j(1-\bar p_j)}{n_j}}
    其中\chi_{\alpha}^2為顯著水平為\alpha且自由度為k-1的\chi_{\alpha}^2值舍扰;\bar p_i\bar p_j總體為i和j的樣本比率倦蚪,n_in_j為樣本容量。
    將三個(gè)樣本比率代入得到CV_{12}=0.138边苹、CV_{13}=0.1379CV_{23}=0.1198
  3. 進(jìn)行比較陵且,任何成對(duì)樣本比率之差的絕對(duì)值|\bar p_i-\bar p_j|超過(guò)其對(duì)應(yīng)的臨界值CV_{ij},則在顯著水平0.05之下个束,成對(duì)的差是顯著的慕购,此時(shí)我們得出相應(yīng)的兩個(gè)總體比率不同。
    image

    從上圖所示茬底,我們只能得到沪悲,\bar p_3明顯大于\bar p_1。而\bar p_2的值分別和\bar p_1以及\bar p_3都沒(méi)有顯著差異阱表。

總結(jié):

  1. 在前面介紹的使用標(biāo)準(zhǔn)正態(tài)分布和檢驗(yàn)統(tǒng)計(jì)量z來(lái)比較兩個(gè)總體比率的假設(shè)檢驗(yàn)殿如,本節(jié)使用\chi^2檢驗(yàn)也可用于兩總體比率相等的假設(shè)檢驗(yàn)。兩種方法結(jié)果相同捶枢,且\chi^2的數(shù)值時(shí)z的數(shù)值的平方握截。區(qū)別在于\chi^2檢驗(yàn)只能用于相等性檢驗(yàn),但總體可以來(lái)源于3個(gè)及以上烂叔。
  2. 在k個(gè)總體中,每個(gè)車主有兩種結(jié)果:“是”固歪、“否”蒜鸡。每個(gè)總體服從二項(xiàng)分布。當(dāng)k個(gè)總體中每一個(gè)有三個(gè)或更多種回答時(shí)牢裳,\chi^2方法有拓展應(yīng)用逢防,此時(shí)每一個(gè)總體服從多項(xiàng)分布。\chi^2計(jì)算的期望頻數(shù)e_{ij}以及檢驗(yàn)統(tǒng)計(jì)量\chi^2的計(jì)算與上述相同蒲讯,不同的是原假設(shè)為對(duì)于所有總體回答變量的多項(xiàng)分布是相同的忘朝。k個(gè)總體中每一個(gè)都有r種回答,則檢驗(yàn)統(tǒng)計(jì)量\chi^2的自由度為(r-1)(k-1)

12.2 獨(dú)立性檢驗(yàn)

\chi^2檢驗(yàn)的一個(gè)重要應(yīng)用是利用樣本數(shù)據(jù)檢驗(yàn)兩個(gè)分類變量的獨(dú)立性判帮,稱作獨(dú)立性檢驗(yàn)(test of independence)局嘁。

舉例:抽取200名飲酒者組成樣本,看他們對(duì)三種類型的啤酒偏好程度晦墙。研究問(wèn)題是:啤酒的偏好是否與飲酒者性別獨(dú)立悦昵。

  • 獨(dú)立性檢驗(yàn)的假設(shè):H_0:啤酒偏好與飲酒者性別獨(dú)立 H_a:啤酒偏好與飲酒者性別不獨(dú)立。數(shù)據(jù)如下圖所示:

    image

  • 將性別作為解釋變量晌畅,(因?yàn)橄胩骄啃詣e對(duì)啤酒偏好的影響)但指。

  • 三種類型啤酒的樣本比率或百分比如下:


    image
  • 首先計(jì)算e_{ij}=\frac{第i行合計(jì)數(shù) \times 第j列的合計(jì)數(shù)}{樣本容量}得到下表

    image

按照公式計(jì)算\chi^2
\chi^2=\sum\limits_{i} \sum\limits_{j} \frac{(f_{ij}-e_{ij})^2}{e_{ij}}
對(duì)于r行c列的表,\chi^2的自由度為(r-1)\times(c-1),且期望頻數(shù)都大于等于5棋凳。

下面是計(jì)算過(guò)程:

image

\chi^2=6.45 在自由度為2的上側(cè)面積即p值為0.0398拦坠,所以拒絕H_0

使用臨界值法的話,可以計(jì)算\alpha=0.05 且自由度為2時(shí)\chi^2的臨界值為5.991剩岳,如果\chi^2大于5.991則拒絕H_0

對(duì)于不同性別對(duì)啤酒的偏愛(ài)如圖所示:


image

總結(jié)

image

12.3 擬合優(yōu)度檢驗(yàn)

本節(jié)贪婉,我們使用\chi^2來(lái)確定被抽樣的總體是否符合某個(gè)特殊的概率分布。首先考慮總體服從一個(gè)歷史的多項(xiàng)概率分布情形卢肃,并使用擬合優(yōu)度檢驗(yàn)來(lái)確定樣本數(shù)據(jù)的總體分布在與歷史的分布相比較中疲迂,是否存在改變。然后考慮假設(shè)總體服從正態(tài)概率分布的情形莫湘,我們利用分布擬合檢驗(yàn)來(lái)確定樣本數(shù)據(jù)是否顯示與正態(tài)概率分布的假設(shè)是適當(dāng)還是不適當(dāng)尤蒿。這兩個(gè)檢驗(yàn)都稱作擬合優(yōu)度檢驗(yàn)

12.3.1 多項(xiàng)概率分布

多項(xiàng)概率分布幅垮,總體中每個(gè)個(gè)體都被分到三個(gè)或多個(gè)類別中的一個(gè)腰池。

舉例:市場(chǎng)調(diào)研公司調(diào)查三個(gè)公司的市場(chǎng)份額,在過(guò)去一年中份額為:p_A=0.3忙芒、p_B=0.5p_c=0.2示弓;C公司有了新產(chǎn)品,想知道新產(chǎn)品上線是否對(duì)市場(chǎng)份額產(chǎn)生影響呵萨。
假設(shè)c公司新產(chǎn)品上市后的市場(chǎng)占有率:H_0:p_A=0.3,p_B=0.5,p_C=0.2 H_a:總體比率不是p_A=0.3,p_B=0.5,p_C=0.2
現(xiàn)取樣本n=200得到觀察頻數(shù)如圖所示:

image

再計(jì)算期望頻數(shù):
image

計(jì)算擬合優(yōu)度的檢驗(yàn)統(tǒng)計(jì)量
\chi^2=\sum \limits_{i=1}^k \frac{(f_i-e_i)^2}{e_i}
f_i為第i類的觀察頻數(shù)奏属;e_i為第i類的期望頻數(shù);k為類別個(gè)數(shù)
注意:當(dāng)所有類別的期望頻數(shù)都大于等于5時(shí)潮峦,檢驗(yàn)統(tǒng)計(jì)量服從自由度為k-1\chi^2分布囱皿。

我們令顯著水平\alpha=0.05,經(jīng)過(guò)下面的計(jì)算過(guò)程得到\chi^2=7.34

image

再利用excel計(jì)算\chi^2=7.34在自由度df=2的上側(cè)面積為0.0255<0.05
或者用臨界值法忱嘹,計(jì)算自由度為2且上側(cè)面積為0.05的\chi^2=5.991
兩種方法的結(jié)論都為拒絕H_o嘱腥,認(rèn)為C公司在新產(chǎn)品引入后的新市場(chǎng)份額與原來(lái)不同。
兩個(gè)市場(chǎng)份額對(duì)比如下:
image

image

看到C公司的新品對(duì)A公司的市場(chǎng)占有率影響更大拘悦。

總結(jié):對(duì)假設(shè)的多項(xiàng)總體分布進(jìn)行擬合優(yōu)度檢驗(yàn)的步驟

image

12.3.2 正態(tài)分布

舉例:公司對(duì)員工進(jìn)行能力測(cè)驗(yàn)齿兔,如果服從正態(tài)分布,就好判斷誰(shuí)是后20%的人础米。

  • 現(xiàn)取樣本容量為n=50
  • 點(diǎn)估計(jì)值:\bar x=68.42 s=10.41
  • 假設(shè):H_0:測(cè)驗(yàn)分?jǐn)?shù)總體服從均值為68.42和標(biāo)準(zhǔn)差為10.41的正態(tài)分布 H_a:測(cè)驗(yàn)分?jǐn)?shù)總體不服從均值為68.42和標(biāo)準(zhǔn)差為10.41的正態(tài)分布
  • 將正態(tài)分布劃分10個(gè)等概率區(qū)間分苇,計(jì)算每個(gè)區(qū)間的邊界z值(需要滿足每個(gè)區(qū)間的期望頻數(shù)大于等于5),這樣做是因?yàn)檎龖B(tài)分布是連續(xù)型的椭盏,我們需要用區(qū)間來(lái)定義類別组砚。


    image
  • 計(jì)算出每個(gè)區(qū)間的邊界的z值和對(duì)應(yīng)的測(cè)驗(yàn)分?jǐn)?shù)


    image
  • 統(tǒng)計(jì)每個(gè)區(qū)間的觀察頻數(shù)(f_i)和期望頻數(shù)(e_i)
    image
  • 根據(jù)觀察頻數(shù)(f_i)和期望頻數(shù)(e_i)計(jì)算\chi^2=\sum \limits_{i=1}^k \frac{(f_i-e_i)^2}{e_i}=7.2,其中自由度為k-p-1=10-2-1=7這里的p指是有樣本估計(jì)的分布參數(shù)的個(gè)數(shù)(這里指的樣本均值和樣本標(biāo)準(zhǔn)差掏颊,使用的樣本估計(jì)值)糟红。
    image

假設(shè)顯著水平為0.1艾帐,通過(guò)計(jì)算自由度為7,\chi^2=7.2的上側(cè)面積即p-值為0.4084>0.1盆偿。因此不能拒絕H_0

總結(jié):正態(tài)分布的擬合優(yōu)度檢驗(yàn)步驟如下

image

image


鏈接: https://pan.baidu.com/s/1fc0q-Q4kj3g-7Fr4MHZaqw 提取碼: 333c 復(fù)制這段內(nèi)容后打開(kāi)百度網(wǎng)盤手機(jī)App柒爸,操作更方便哦

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市事扭,隨后出現(xiàn)的幾起案子捎稚,更是在濱河造成了極大的恐慌,老刑警劉巖求橄,帶你破解...
    沈念sama閱讀 221,820評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件今野,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡罐农,警方通過(guò)查閱死者的電腦和手機(jī)条霜,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,648評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)涵亏,“玉大人宰睡,你說(shuō)我怎么就攤上這事∑睿” “怎么了拆内?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,324評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)宠默。 經(jīng)常有香客問(wèn)我麸恍,道長(zhǎng),這世上最難降的妖魔是什么光稼? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,714評(píng)論 1 297
  • 正文 為了忘掉前任或南,我火速辦了婚禮,結(jié)果婚禮上艾君,老公的妹妹穿的比我還像新娘。我一直安慰自己肄方,他們只是感情好冰垄,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,724評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著权她,像睡著了一般虹茶。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上隅要,一...
    開(kāi)封第一講書(shū)人閱讀 52,328評(píng)論 1 310
  • 那天蝴罪,我揣著相機(jī)與錄音,去河邊找鬼步清。 笑死要门,一個(gè)胖子當(dāng)著我的面吹牛虏肾,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播欢搜,決...
    沈念sama閱讀 40,897評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼封豪,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了炒瘟?” 一聲冷哼從身側(cè)響起吹埠,我...
    開(kāi)封第一講書(shū)人閱讀 39,804評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎疮装,沒(méi)想到半個(gè)月后缘琅,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,345評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡廓推,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,431評(píng)論 3 340
  • 正文 我和宋清朗相戀三年刷袍,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片受啥。...
    茶點(diǎn)故事閱讀 40,561評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡做个,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出滚局,到底是詐尸還是另有隱情居暖,我是刑警寧澤,帶...
    沈念sama閱讀 36,238評(píng)論 5 350
  • 正文 年R本政府宣布藤肢,位于F島的核電站太闺,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏嘁圈。R本人自食惡果不足惜省骂,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,928評(píng)論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望最住。 院中可真熱鬧钞澳,春花似錦、人聲如沸涨缚。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,417評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)脓魏。三九已至兰吟,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間茂翔,已是汗流浹背混蔼。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,528評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留珊燎,地道東北人惭嚣。 一個(gè)月前我還...
    沈念sama閱讀 48,983評(píng)論 3 376
  • 正文 我出身青樓遵湖,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親料按。 傳聞我的和親對(duì)象是個(gè)殘疾皇子奄侠,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,573評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容