[說人話的統(tǒng)計學(xué)·協(xié)和八]第四章·下 方差分析(ANOVA)-多組平均數(shù)的比較

注:說人話的統(tǒng)計學(xué)系列原連載于協(xié)和八微信公眾號。本文為筆者的學(xué)習(xí)筆記瓤球,每篇文章標(biāo)題已加入原文超鏈接融欧。如侵權(quán)請告知。

07 沒聽說過多因素ANOVA卦羡?那你可就OUT了噪馏!| 協(xié)和八

多因素 ANOVA(multi-factor ANOVA)

多因素 ANOVA 顧名思義就是會同時檢驗(yàn)多個因素對測量值的影響,多因素 ANOVA 應(yīng)用非常廣泛绿饵,比如研究新型藥物對疾病的治愈能力往往還要考慮到患者的年齡性別等因素欠肾,研究學(xué)歷對薪水的影響也要考慮到家庭背景等其它社會因素才能讓結(jié)果更有說服力。

多因素 ANOVA 不僅考慮每個因素單獨(dú)對要檢驗(yàn)的量的影響拟赊,還會考慮到因素之間的交互效應(yīng)刺桃。
與單因素 ANOVA 一樣,多因素 ANOVA 需要每個條件下的數(shù)據(jù)都服從正態(tài)分布吸祟,且不同組的數(shù)據(jù)方差相等瑟慈,也就是說在我們在計算組內(nèi)平方和時用到的誤差項要服從正態(tài)分布。另外和之前講過的所有檢驗(yàn)方法一樣欢搜,每一個數(shù)據(jù)樣本也要相互獨(dú)立封豪。
對每個實(shí)驗(yàn)分組都采集了相同數(shù)量的樣本,這又叫做等重復(fù)實(shí)驗(yàn)的方差分析( balanced design ANOVA)炒瘟。

08 多因素ANOVA=好幾個單因素ANOVA吹埠?可沒這么簡單!| 協(xié)和八

多因素 ANOVA 疮装,可以用單獨(dú)的點(diǎn)來表示各組的平均值缘琅,再加上誤差棒,然后再用合適的標(biāo)記把不同因素區(qū)分開來廓推,被很多統(tǒng)計學(xué)書籍稱為「輪廓圖」或「剖面圖」(profile plot)刷袍。我們認(rèn)為,這兩個中文譯法并不是特別好樊展。英文 profile 有幾個不同的含義呻纹,在這里的意思更多是「主要特征」堆生。

只需要看一下不在坐標(biāo)軸上的那個因素所對應(yīng)的不同水平的折線是否大致平行——如果平行,那么就很可能沒有交互效應(yīng)雷酪,反之則表示可能有交互效應(yīng)隶债。


09 兩個因素相互影響煞檩,ANOVA結(jié)果該如何判讀?| 協(xié)和八

自由度是每個因素分組的數(shù)量減去 1棉钧,比如性別共分男女兩組世剖,所以性別自由度是 1零远;交互效應(yīng)的自由度是每個因素自由度的乘積撇叁。最后一行 residuals(殘差) 指的是不能被所研究的因素解釋的那部分波動性窖认,其自由度就是總樣本量 30 減去總分組數(shù)。各個因素排列組合共有 2*2=4 種情況锌钮,所以總分組數(shù)是 4桥温,殘差的自由度是 26 。

殘差的總平方和就是我們之前提到的組內(nèi)平方和梁丘,而其他行的總平方和就是組間平方和策治。平均平方和就是總平方和除以自由度,而 F 值就是某個因素的平均平方和除以殘差的平均平方和兰吟。也就是說知道了自由度和總平方和,可以計算出平均平方和以及 F 值茂翔。最后知道了 F 值還要自由度混蔼,就可以計算出 p 值。在自由度不變的情況下珊燎,F(xiàn) 值越大惭嚣,P 值越小。

做多因素 ANOVA 分析的方法

首先悔政,需要對數(shù)據(jù)進(jìn)行可視化晚吞,對可能出現(xiàn)的結(jié)果有一個預(yù)期,尤其要注意是否會有無序的交互作用谋国;
然后對數(shù)據(jù)使用多因素 ANOVA 分析槽地,如果沒有交互效應(yīng),可以通過主效應(yīng)判斷因素是否對測量值有顯著影響芦瘾,如果發(fā)現(xiàn)有無序的交互效應(yīng)捌蚊, 則必須還要做事后檢驗(yàn),對結(jié)果的討論也要圍繞事后檢驗(yàn)兩兩比較的結(jié)果進(jìn)行近弟。

10 ANOVA還能搞三四五因素缅糟?等等,我頭有點(diǎn)兒暈…… | 協(xié)和八

三因素ANOVA

因變量必須是連續(xù)型變量(continuous variable)祷愉,比如身高窗宦、體重赦颇、收入、耗費(fèi)的時間赴涵、考試分?jǐn)?shù)等媒怯。
自變量(也就是 ANOVA 里的三個「因素」)得是離散型變量(discrete variable,或者叫分類變量 categorical variable)句占,比如說性別沪摄、種族、職業(yè)之類纱烘。
三個因素不同水平的組合對應(yīng)于互不相同的受試者——換言之杨拐,這是一個「受試間」設(shè)計(between-subjects design)。
「受試內(nèi)」設(shè)計(within-subjects design)要使用重復(fù)測量多因素 ANOVA(repeated-measures multi-factor ANOVA)擂啥。

服從正態(tài)分布
所有分組(三個因素不同水平的所有組合)內(nèi)的數(shù)據(jù)(近似)服從正態(tài)分布箱線圖哄陶、頻率直方圖、Q-Q 圖 Shapiro-Wilk 檢驗(yàn)數(shù)據(jù)變換
方差相等
Levene 氏檢驗(yàn)

當(dāng)我們使用三因素 ANOVA 時哺壶,結(jié)果要從三維交互效應(yīng)看起:

如果三維交互效應(yīng)顯著屋吨,則要把整個數(shù)據(jù)集按照某一個因素不同取值拆開,然后在得到的多個「子數(shù)據(jù)集」(就好像上面例子中按職位分開畫輪廓圖一樣)中做兩因素ANOVA山宾,對另兩個因素的二維交互效應(yīng)進(jìn)行考察至扰;

如果三維交互效應(yīng)不顯著,則進(jìn)一步考察整個樣本中三個因素兩兩組合得到的三個二維交互效應(yīng)的顯著性资锰。同樣敢课,如果二維交互效應(yīng)顯著,則需要繼續(xù)在一個因素不同取值下拆分?jǐn)?shù)據(jù)集绷杜,分別考慮另一因素的主效應(yīng)直秆;如果二維交互效應(yīng)不顯著,則直接考慮整個樣本中單個因素的主效應(yīng)鞭盟。

11 要做ANOVA圾结,樣本量多大才夠用? | 協(xié)和八

樣本量主要由三個因素決定:統(tǒng)計功效齿诉,效應(yīng)大小還有顯著性水平筝野。這不僅在t檢驗(yàn)里面成立,在ANOVA里面也一樣成立鹃两。
統(tǒng)計功效顯著性水平按照慣例一般設(shè)為0.8和0.05
ANOVA的效應(yīng)大小常用Cohen氏 f 值或者η2衡量

非重復(fù)測量ANOVA

在單因素ANOVA檢驗(yàn)中遗座,小效應(yīng)對應(yīng)f值在0.1左右,中效應(yīng)對應(yīng)的f值在0.25左右俊扳,大效應(yīng)在0.4左右途蒋。

有了統(tǒng)計功效,效應(yīng)大小馋记,顯著性水平三個參數(shù)的值号坡,我們便可以用之前推薦過的免費(fèi)功效分析軟件GPower(或者其他具有功效分析功能或模塊的統(tǒng)計學(xué)軟件)來確定樣本量懊烤。在GPower中,ANOVA與t 檢驗(yàn)的區(qū)別主要是test family要選擇f tests宽堆,在最常見的單因素ANOVA情況下statistical tests要選擇ANOVA:fixed effects, omnibus, one-way

重復(fù)測量ANOVA

計算重復(fù)測量ANOVA的效應(yīng)大小腌紧,我們同樣也要考慮到個體間的差異。


對比重復(fù)測量ANOVA和不考慮重復(fù)測量結(jié)構(gòu)ANOVA畜隶,我們可以看到前者得到的效應(yīng)會大一些壁肋,也就是說獲得同樣的統(tǒng)計功效,前者所需要的樣本數(shù)量更小籽慢。

當(dāng)我們設(shè)計實(shí)驗(yàn)的時候浸遗,為了有更高的統(tǒng)計功效,減少實(shí)驗(yàn)所需的樣本量箱亿,要盡可能地利用重復(fù)測量的設(shè)計跛锌。比如我們在研究小鼠的體重是否隨年齡變化,我們需要在三個月届惋,四個月髓帽,五個月三個時間點(diǎn)測量小鼠的體重。實(shí)驗(yàn)方案一脑豹,從同樣的10只小鼠身上在這三個時間點(diǎn)分別獲得體重數(shù)據(jù)郑藏,共需要10只鼠;實(shí)驗(yàn)方案二瘩欺,每個時間點(diǎn)采集10只小鼠的數(shù)據(jù)译秦,但是不同時間點(diǎn)采集的并不是同一批小鼠的體重,共需要30只鼠击碗。方案一不僅用到的鼠的數(shù)量更少,而且得到的統(tǒng)計功效反而更高们拙,所以會更優(yōu)稍途。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市砚婆,隨后出現(xiàn)的幾起案子械拍,更是在濱河造成了極大的恐慌,老刑警劉巖装盯,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件坷虑,死亡現(xiàn)場離奇詭異,居然都是意外死亡埂奈,警方通過查閱死者的電腦和手機(jī)迄损,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來账磺,“玉大人芹敌,你說我怎么就攤上這事痊远。” “怎么了氏捞?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵碧聪,是天一觀的道長。 經(jīng)常有香客問我液茎,道長逞姿,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任捆等,我火速辦了婚禮滞造,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘楚里。我一直安慰自己断部,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布班缎。 她就那樣靜靜地躺著蝴光,像睡著了一般。 火紅的嫁衣襯著肌膚如雪达址。 梳的紋絲不亂的頭發(fā)上蔑祟,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天,我揣著相機(jī)與錄音沉唠,去河邊找鬼疆虚。 笑死,一個胖子當(dāng)著我的面吹牛满葛,可吹牛的內(nèi)容都是我干的径簿。 我是一名探鬼主播,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼嘀韧,長吁一口氣:“原來是場噩夢啊……” “哼篇亭!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起锄贷,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤译蒂,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后谊却,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體柔昼,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年炎辨,在試婚紗的時候發(fā)現(xiàn)自己被綠了捕透。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖激率,靈堂內(nèi)的尸體忽然破棺而出咳燕,到底是詐尸還是另有隱情,我是刑警寧澤乒躺,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布招盲,位于F島的核電站嘉冒,受9級特大地震影響曹货,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜讳推,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望礼饱。 院中可真熱鬧镊绪,春花似錦蝴韭、人聲如沸熙侍。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至巷送,卻和暖如春减余,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背惩系。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留如筛,地道東北人堡牡。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像杨刨,于是被迫代替她去往敵國和親晤柄。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容