注:說人話的統(tǒng)計學(xué)系列原連載于協(xié)和八微信公眾號。本文為筆者的學(xué)習(xí)筆記瓤球,每篇文章標(biāo)題已加入原文超鏈接融欧。如侵權(quán)請告知。
07 沒聽說過多因素ANOVA卦羡?那你可就OUT了噪馏!| 協(xié)和八
多因素 ANOVA(multi-factor ANOVA)
多因素 ANOVA 顧名思義就是會同時檢驗(yàn)多個因素對測量值的影響,多因素 ANOVA 應(yīng)用非常廣泛绿饵,比如研究新型藥物對疾病的治愈能力往往還要考慮到患者的年齡性別等因素欠肾,研究學(xué)歷對薪水的影響也要考慮到家庭背景等其它社會因素才能讓結(jié)果更有說服力。
多因素 ANOVA 不僅考慮每個因素單獨(dú)對要檢驗(yàn)的量的影響拟赊,還會考慮到因素之間的交互效應(yīng)刺桃。
與單因素 ANOVA 一樣,多因素 ANOVA 需要每個條件下的數(shù)據(jù)都服從正態(tài)分布吸祟,且不同組的數(shù)據(jù)方差相等瑟慈,也就是說在我們在計算組內(nèi)平方和時用到的誤差項要服從正態(tài)分布。另外和之前講過的所有檢驗(yàn)方法一樣欢搜,每一個數(shù)據(jù)樣本也要相互獨(dú)立封豪。
對每個實(shí)驗(yàn)分組都采集了相同數(shù)量的樣本,這又叫做等重復(fù)實(shí)驗(yàn)的方差分析( balanced design ANOVA)炒瘟。
08 多因素ANOVA=好幾個單因素ANOVA吹埠?可沒這么簡單!| 協(xié)和八
多因素 ANOVA 疮装,可以用單獨(dú)的點(diǎn)來表示各組的平均值缘琅,再加上誤差棒,然后再用合適的標(biāo)記把不同因素區(qū)分開來廓推,被很多統(tǒng)計學(xué)書籍稱為「輪廓圖」或「剖面圖」(profile plot)刷袍。我們認(rèn)為,這兩個中文譯法并不是特別好樊展。英文 profile 有幾個不同的含義呻纹,在這里的意思更多是「主要特征」堆生。
只需要看一下不在坐標(biāo)軸上的那個因素所對應(yīng)的不同水平的折線是否大致平行——如果平行,那么就很可能沒有交互效應(yīng)雷酪,反之則表示可能有交互效應(yīng)隶债。
09 兩個因素相互影響煞檩,ANOVA結(jié)果該如何判讀?| 協(xié)和八
自由度是每個因素分組的數(shù)量減去 1棉钧,比如性別共分男女兩組世剖,所以性別自由度是 1零远;交互效應(yīng)的自由度是每個因素自由度的乘積撇叁。最后一行 residuals(殘差) 指的是不能被所研究的因素解釋的那部分波動性窖认,其自由度就是總樣本量 30 減去總分組數(shù)。各個因素排列組合共有 2*2=4 種情況锌钮,所以總分組數(shù)是 4桥温,殘差的自由度是 26 。
殘差的總平方和就是我們之前提到的組內(nèi)平方和梁丘,而其他行的總平方和就是組間平方和策治。平均平方和就是總平方和除以自由度,而 F 值就是某個因素的平均平方和除以殘差的平均平方和兰吟。也就是說知道了自由度和總平方和,可以計算出平均平方和以及 F 值茂翔。最后知道了 F 值還要自由度混蔼,就可以計算出 p 值。在自由度不變的情況下珊燎,F(xiàn) 值越大惭嚣,P 值越小。
做多因素 ANOVA 分析的方法
首先悔政,需要對數(shù)據(jù)進(jìn)行可視化晚吞,對可能出現(xiàn)的結(jié)果有一個預(yù)期,尤其要注意是否會有無序的交互作用谋国;
然后對數(shù)據(jù)使用多因素 ANOVA 分析槽地,如果沒有交互效應(yīng),可以通過主效應(yīng)判斷因素是否對測量值有顯著影響芦瘾,如果發(fā)現(xiàn)有無序的交互效應(yīng)捌蚊, 則必須還要做事后檢驗(yàn),對結(jié)果的討論也要圍繞事后檢驗(yàn)兩兩比較的結(jié)果進(jìn)行近弟。
10 ANOVA還能搞三四五因素缅糟?等等,我頭有點(diǎn)兒暈…… | 協(xié)和八
三因素ANOVA
因變量必須是連續(xù)型變量(continuous variable)祷愉,比如身高窗宦、體重赦颇、收入、耗費(fèi)的時間赴涵、考試分?jǐn)?shù)等媒怯。
自變量(也就是 ANOVA 里的三個「因素」)得是離散型變量(discrete variable,或者叫分類變量 categorical variable)句占,比如說性別沪摄、種族、職業(yè)之類纱烘。
三個因素不同水平的組合對應(yīng)于互不相同的受試者——換言之杨拐,這是一個「受試間」設(shè)計(between-subjects design)。
「受試內(nèi)」設(shè)計(within-subjects design)要使用重復(fù)測量多因素 ANOVA(repeated-measures multi-factor ANOVA)擂啥。
服從正態(tài)分布
所有分組(三個因素不同水平的所有組合)內(nèi)的數(shù)據(jù)(近似)服從正態(tài)分布箱線圖哄陶、頻率直方圖、Q-Q 圖 Shapiro-Wilk 檢驗(yàn)數(shù)據(jù)變換
方差相等
Levene 氏檢驗(yàn)
當(dāng)我們使用三因素 ANOVA 時哺壶,結(jié)果要從三維交互效應(yīng)看起:
如果三維交互效應(yīng)顯著屋吨,則要把整個數(shù)據(jù)集按照某一個因素不同取值拆開,然后在得到的多個「子數(shù)據(jù)集」(就好像上面例子中按職位分開畫輪廓圖一樣)中做兩因素ANOVA山宾,對另兩個因素的二維交互效應(yīng)進(jìn)行考察至扰;
如果三維交互效應(yīng)不顯著,則進(jìn)一步考察整個樣本中三個因素兩兩組合得到的三個二維交互效應(yīng)的顯著性资锰。同樣敢课,如果二維交互效應(yīng)顯著,則需要繼續(xù)在一個因素不同取值下拆分?jǐn)?shù)據(jù)集绷杜,分別考慮另一因素的主效應(yīng)直秆;如果二維交互效應(yīng)不顯著,則直接考慮整個樣本中單個因素的主效應(yīng)鞭盟。
11 要做ANOVA圾结,樣本量多大才夠用? | 協(xié)和八
樣本量主要由三個因素決定:統(tǒng)計功效齿诉,效應(yīng)大小還有顯著性水平筝野。這不僅在t檢驗(yàn)里面成立,在ANOVA里面也一樣成立鹃两。
統(tǒng)計功效和顯著性水平按照慣例一般設(shè)為0.8和0.05
ANOVA的效應(yīng)大小常用Cohen氏 f 值或者η2衡量
非重復(fù)測量ANOVA
在單因素ANOVA檢驗(yàn)中遗座,小效應(yīng)對應(yīng)f值在0.1左右,中效應(yīng)對應(yīng)的f值在0.25左右俊扳,大效應(yīng)在0.4左右途蒋。
有了統(tǒng)計功效,效應(yīng)大小馋记,顯著性水平三個參數(shù)的值号坡,我們便可以用之前推薦過的免費(fèi)功效分析軟件GPower(或者其他具有功效分析功能或模塊的統(tǒng)計學(xué)軟件)來確定樣本量懊烤。在GPower中,ANOVA與t 檢驗(yàn)的區(qū)別主要是test family要選擇f tests宽堆,在最常見的單因素ANOVA情況下statistical tests要選擇ANOVA:fixed effects, omnibus, one-way
重復(fù)測量ANOVA
計算重復(fù)測量ANOVA的效應(yīng)大小腌紧,我們同樣也要考慮到個體間的差異。
對比重復(fù)測量ANOVA和不考慮重復(fù)測量結(jié)構(gòu)ANOVA畜隶,我們可以看到前者得到的效應(yīng)會大一些壁肋,也就是說獲得同樣的統(tǒng)計功效,前者所需要的樣本數(shù)量更小籽慢。
當(dāng)我們設(shè)計實(shí)驗(yàn)的時候浸遗,為了有更高的統(tǒng)計功效,減少實(shí)驗(yàn)所需的樣本量箱亿,要盡可能地利用重復(fù)測量的設(shè)計跛锌。比如我們在研究小鼠的體重是否隨年齡變化,我們需要在三個月届惋,四個月髓帽,五個月三個時間點(diǎn)測量小鼠的體重。實(shí)驗(yàn)方案一脑豹,從同樣的10只小鼠身上在這三個時間點(diǎn)分別獲得體重數(shù)據(jù)郑藏,共需要10只鼠;實(shí)驗(yàn)方案二瘩欺,每個時間點(diǎn)采集10只小鼠的數(shù)據(jù)译秦,但是不同時間點(diǎn)采集的并不是同一批小鼠的體重,共需要30只鼠击碗。方案一不僅用到的鼠的數(shù)量更少,而且得到的統(tǒng)計功效反而更高们拙,所以會更優(yōu)稍途。