參考書《白話統(tǒng)計學》
非參數(shù)檢驗
卡方獨立性檢驗
適用于數(shù)據(jù)來自兩個分類的變量塘秦,樣本對象通過分類變量分成不同類型歧焦,檢測根據(jù)一個變量進行的對象劃分是否獨立于另一個分類變量。
比如多個年級的男女生茶没,檢測男女生的學習成績是否取決于它的年級妻献。
卡方檢驗的目的
確定樣本對象落入個類別的比例是否與隨機期望比例相等
例如
image
想知道男生與女生在專業(yè)選擇上是否不同
原理
將已收集分類編碼數(shù)據(jù)的頻數(shù)(觀測頻數(shù))與純碎隨機落入表格中每一單元格的預期頻數(shù)相比較,確定觀測頻數(shù)是否顯著的異于預期頻數(shù)蜘犁。
計算卡方值需要加入列合計計數(shù)和行合計計數(shù)赋铝,也就是列聯(lián)表,這種分析檢驗的是一個變量的一個類別中包括的對象數(shù)是否視另一個變量而定
image
以心理學男生為例沽瘦,給定整個樣本中的男生人數(shù)和心理學專業(yè)人數(shù)革骨,可以預期樣本中會隨機包括多少心理學男生
預期心理學男生人數(shù)
即男生總?cè)藬?shù)除以整個樣本容量,心理學專業(yè)總?cè)藬?shù)除以樣本總?cè)藬?shù)析恋,兩個比例相乘良哲,乘以樣本總?cè)藬?shù)。其他單元格同理
image
比較預期值和觀測值計算卡方統(tǒng)計量
image
- 卡方獨立性檢驗的自由度
R是列聯(lián)表的行數(shù)助隧,C是列數(shù)