【統(tǒng)計筆記】常用統(tǒng)計方法——卡方檢驗(獨立性檢驗)

總結(jié):
使用條件:定類變量逼争,大于等于兩組
數(shù)據(jù)集存放:原始數(shù)據(jù)直接用勇凭;統(tǒng)計過的數(shù)據(jù)需要加權(quán)個案
卡方值的選擇:需要根據(jù)樣本量n和格子中的理論數(shù)E來定婿斥。通常2*2數(shù)據(jù)量少的話用費舍卡方挖诸。

一 簡介

MBA智庫-百科-卡方檢驗詳情

  • 卡方檢驗主要應(yīng)用于定類變量和定類變量之間的關(guān)系,比如驗證不同性別下使用電腦品牌是否存在差異卒废。
  • 也稱獨立性檢驗,是一種非參數(shù)假設(shè)檢驗宙地。即利用卡方分布去做的假設(shè)檢驗摔认。
  • 關(guān)鍵詞:
  1. 卡方分布
    統(tǒng)計學(xué)中三大分布,卡方分布宅粥,t分布参袱,F(xiàn)分布,都是由正態(tài)分布推導(dǎo)而來。
  2. 假設(shè)檢驗
  3. 類別變量
  4. 自由度 Df=(r-1)(c-1)
  5. 卡方值與P值
    P值:小拒大接
  6. 非參數(shù)檢驗
  7. 顯著性水平:在原假設(shè)成立下抹蚀,拒絕原假設(shè)的概率剿牺,即犯第一錯誤的概率。

二 原理

(一)卡方檢驗統(tǒng)計量

image.png
  • 小結(jié)
  1. 分子代表實際值與期望值的偏差(平方是為了消除負值影響)环壤,分母代表標準化晒来。因此卡方統(tǒng)計量的值越小,代表觀測頻數(shù)與理論頻數(shù)越接近郑现;
  2. 因為我們的原假設(shè)是:兩個變量是獨立的湃崩。(通常原假設(shè)是我們想要推翻的,我們想證明的結(jié)論一般放在備擇假設(shè)中)因此如果卡方統(tǒng)計量的值越大接箫,對應(yīng)的P值越小竹习,小拒大接,則拒絕原假設(shè)列牺,說明兩個變量相關(guān)整陌;反之,卡方值越小瞎领,接受原假設(shè)泌辫,說明兩變量是獨立的
    (為什么?我的理解:卡方值越小九默,偏差小震放,說明這兩個變量越符合卡方分布,而卡方分布的前提就是變量間的獨立性驼修,因此證明這兩個變量是獨立的)

(二)基本流程

image.png

三 使用工具

SPSS卡方檢驗

  1. 如何存放數(shù)據(jù)集殿遂?
    在使用SPSS卡方檢驗時,有兩種存放數(shù)據(jù)集方式乙各。
    第一種使用的是已經(jīng)加工好的數(shù)據(jù)墨礁,需要創(chuàng)建三個變量值(類別1,類別2耳峦,數(shù)量)恩静。此時一定要先對頻數(shù)加權(quán)個案,就是要告訴spss實際樣本很多蹲坷,有相應(yīng)的頻數(shù)之“和”那么多驶乾;如果不選擇,spss就會默認一行一個樣本數(shù)據(jù)循签;

第二種是直接使用原始樣本(即有多少樣本量就有多少行)


image.png
  1. 使用卡方檢驗有哪些前提條件级乐?

R×C表卡方檢驗應(yīng)用條件:
(1)R×C表中理論數(shù)小于5的格子不能超過1/5;
(2)不能有小于1的理論數(shù)县匠。如果實驗中有不符合R×C表的卡方檢驗风科,可以通過增加樣本數(shù)撒轮、列合并來實現(xiàn)。

  1. 使用哪個卡方值更準確丐重?

需要結(jié)合X和Y的類別個數(shù)腔召,樣本量,以及期望頻數(shù)格子分布情況等扮惦,選擇最終應(yīng)該使用的卡方值臀蛛。
n代表總樣本量;E代表期望頻數(shù)崖蜜;R代表X的類別個數(shù)浊仆;C代表Y的類別個數(shù)。
通常情況下豫领,共有三種卡方值抡柿,分別是Pearson卡方,yates校正卡方等恐,F(xiàn)isher卡方洲劣;優(yōu)先使用Pearson卡方,其次為yates校正卡方课蔬,最后為Fisher卡方囱稽。

  • 針對2*2(R=2,C=2)
  • 所有的理論數(shù)T≥5并且總樣本量n≥40二跋,用Pearson卡方進行檢驗战惊。
  • 如果理論數(shù)T<5但T≥1,并且n≥40扎即,用連續(xù)性校正的卡方進行檢驗吞获。
  • 如果有理論數(shù)T<1或n<40,則用Fisher’s檢驗谚鄙。
  • 針對R*C(R各拷,C中任意一個大于2;且R>=2,且C>=2)

E全部>1 且 1 <=E<5格子的比例小于20% 則使用Pearson卡方襟锐,否則使用yates校正卡方撤逢。(?)

  1. 文字分析描述怎么寫?
    從上表可知粮坞,類別1與類別2在統(tǒng)計學(xué)意義上存在顯著性差異(χ2=7.054,p =0.029 < 0.05)。具體描述再通過對比百分比尋找差異初狰。
    如果想了解兩個類別的相關(guān)強度莫杈,在SPSS交叉表-統(tǒng)計量-勾選相關(guān)性,查看相關(guān)系數(shù)奢入。(弱相關(guān)筝闹、中度相關(guān)和強相關(guān)的分解線系數(shù)分別為0.1媳叨,0.3,0.5)
  2. 卡方檢驗的缺陷
    卡方檢驗只能判斷各組間是否存在差異关顷,如果想要進一步確認具體是哪些組之間存在了差異糊秆,需要對結(jié)果更深入分析,即使用兩兩比較议双,見SPSS:多個樣本率的卡方檢驗及兩兩比較
  3. SPSS非參數(shù)檢驗中的卡方檢驗有什么區(qū)別痘番?
    簡單來說,交叉表是多變量的交叉平痰,非參數(shù)中的卡方檢驗是單個變量的差異分析汞舱。比如檢驗商場一周從周一到周日每天人流量是否有差異。
    知乎-踩坑總結(jié)
    筆記18:SPSS交叉表卡方與非參數(shù)卡方檢驗有何區(qū)別宗雇?附案例

Python-卡方檢驗

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末昂芜,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子赔蒲,更是在濱河造成了極大的恐慌泌神,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,000評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件舞虱,死亡現(xiàn)場離奇詭異欢际,居然都是意外死亡,警方通過查閱死者的電腦和手機砾嫉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,745評論 3 399
  • 文/潘曉璐 我一進店門幼苛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人焕刮,你說我怎么就攤上這事舶沿。” “怎么了配并?”我有些...
    開封第一講書人閱讀 168,561評論 0 360
  • 文/不壞的土叔 我叫張陵括荡,是天一觀的道長。 經(jīng)常有香客問我溉旋,道長畸冲,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,782評論 1 298
  • 正文 為了忘掉前任观腊,我火速辦了婚禮邑闲,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘梧油。我一直安慰自己苫耸,他們只是感情好,可當我...
    茶點故事閱讀 68,798評論 6 397
  • 文/花漫 我一把揭開白布儡陨。 她就那樣靜靜地躺著褪子,像睡著了一般量淌。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上嫌褪,一...
    開封第一講書人閱讀 52,394評論 1 310
  • 那天呀枢,我揣著相機與錄音,去河邊找鬼笼痛。 笑死裙秋,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的晃痴。 我是一名探鬼主播残吩,決...
    沈念sama閱讀 40,952評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼倘核!你這毒婦竟也來了泣侮?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,852評論 0 276
  • 序言:老撾萬榮一對情侶失蹤紧唱,失蹤者是張志新(化名)和其女友劉穎活尊,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體漏益,經(jīng)...
    沈念sama閱讀 46,409評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡蛹锰,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,483評論 3 341
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了绰疤。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片铜犬。...
    茶點故事閱讀 40,615評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖轻庆,靈堂內(nèi)的尸體忽然破棺而出癣猾,到底是詐尸還是另有隱情,我是刑警寧澤余爆,帶...
    沈念sama閱讀 36,303評論 5 350
  • 正文 年R本政府宣布纷宇,位于F島的核電站,受9級特大地震影響蛾方,放射性物質(zhì)發(fā)生泄漏像捶。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,979評論 3 334
  • 文/蒙蒙 一桩砰、第九天 我趴在偏房一處隱蔽的房頂上張望拓春。 院中可真熱鬧,春花似錦亚隅、人聲如沸痘儡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,470評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽沉删。三九已至,卻和暖如春醉途,著一層夾襖步出監(jiān)牢的瞬間矾瑰,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,571評論 1 272
  • 我被黑心中介騙來泰國打工隘擎, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留殴穴,地道東北人。 一個月前我還...
    沈念sama閱讀 49,041評論 3 377
  • 正文 我出身青樓货葬,卻偏偏與公主長得像采幌,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子震桶,可洞房花燭夜當晚...
    茶點故事閱讀 45,630評論 2 359