什么是卡方分析
卡方分析又稱卡方檢驗(yàn),主要用于兩組樣本或是兩個(gè)分類變量之間相關(guān)性的分析茁帽。其根本思想是利用樣本的實(shí)際頻數(shù)和理論頻數(shù)的吻合度董饰,來(lái)判斷樣本是否符合預(yù)期。
卡方分析是基于卡方分布的統(tǒng)計(jì)方法倦淀。其主旨思想是:先假設(shè)實(shí)際和理論沒(méi)有區(qū)別蒋畜,然后計(jì)算卡方值,以此估計(jì)理論與實(shí)際的偏離程度撞叽,從而決定接受還是拒絕最初的假設(shè)姻成。
卡方分析的計(jì)算
卡方分析能做什么
(1) 檢驗(yàn)?zāi)硞€(gè)變量是否服從某分布
(2) 驗(yàn)證某分類變量的某類概率是否為指定值
(3) 驗(yàn)證某兩類變量是否獨(dú)立
(4) 控制某些變量后浙于,另兩個(gè)變量是相互獨(dú)立
(5) 驗(yàn)證兩種方法的效果是否一致
卡方分析對(duì)數(shù)據(jù)的要求
總體來(lái)說(shuō),數(shù)據(jù)量越多越好挟纱。每個(gè)類別期望頻數(shù)不能小于1羞酗。要求期望頻數(shù)大于5的數(shù)量超過(guò)4/5
典型案例
(1) 驗(yàn)證某隨機(jī)變量是否服從某分布,用一個(gè)離散分布和一個(gè)連續(xù)分布來(lái)說(shuō)明紊服。
(2) 驗(yàn)證某分類變量的各類概率是否為指定值。如投硬幣正反概率為0.5
(3) 驗(yàn)證某兩類變量是否獨(dú)立槐雾,我們有喝牛奶和得感冒兩者的關(guān)系來(lái)說(shuō)明夭委,如圖所示
(4) 控制某些變量后,兩變量是否獨(dú)立
(5) 驗(yàn)證兩種方法效果是否一致,這里用民眾對(duì)北京和南京的環(huán)衛(wèi)滿意度來(lái)說(shuō)明擎值,如圖所示
寫(xiě)在最后
- 為什么H0假設(shè)一定是假設(shè)觀察頻數(shù)和期望頻數(shù)一致、相同汹粤、無(wú)關(guān)命斧。只有這樣,才能從觀察值嘱兼,計(jì)算出期望值国葬。從而檢驗(yàn)觀察值和期望值的差距。如果直接假設(shè)觀察頻數(shù)和期望頻數(shù)不一致芹壕,不同汇四,相關(guān)。那么將無(wú)法計(jì)算期望值踢涌。
- 計(jì)算自由度V=(行數(shù)-1)(列數(shù)-1)通孽,一般的顯著度=0.05,可以在Excel中選擇任意方格輸入:=CHIINV(0.05,3)睁壁,即可計(jì)算顯著度=0.05時(shí)利虫,自由度V=3的卡方值。查表值大于計(jì)算值堡僻,接受原假設(shè)糠惫,否則拒絕。
- 若觀測(cè)頻數(shù)值小于5钉疫,應(yīng)該將該項(xiàng)合并至相鄰項(xiàng)中
參考鏈接1