醫(yī)咖會(huì)學(xué)習(xí)筆記—Day 2—獨(dú)立樣本t檢驗(yàn)

一只锭、問(wèn)題與數(shù)據(jù)

某廣告公司制作了一段電視宣傳視頻,希望能夠同時(shí)吸引男性和女性購(gòu)買者的注意≡憾現(xiàn)該公司共招募20位男性和20位女性研究對(duì)象,請(qǐng)他們觀看電視宣傳視頻后為視頻評(píng)分邀摆,并根據(jù)兩組分?jǐn)?shù)對(duì)比判斷男纵顾、女受試者對(duì)該視頻的喜好程度隧熙。他們收集了研究對(duì)象的性別(gender)和評(píng)分(engagement)。

二、對(duì)問(wèn)題分析

研究者擬分析兩組數(shù)據(jù)均值是否有差異音念,即根據(jù)兩組的評(píng)分沪饺,判斷男性和女性對(duì)該視頻的喜好程度闷愤。針對(duì)這種情況,我們可以使用獨(dú)立樣本t檢驗(yàn)讥脐,但需要先滿足6項(xiàng)假設(shè):

  • 假設(shè)1:觀測(cè)變量為連續(xù)變量遭居,如本研究中的評(píng)分為連續(xù)變量旬渠。
  • 假設(shè)2:觀測(cè)變量分為2組,如本研究中分為男性組和女性組告丢。
  • 假設(shè)3:觀測(cè)值之間相互獨(dú)立枪蘑,如本研究中各位研究對(duì)象的信息都是獨(dú)立的岖免,不存在相互干擾岳颇。
  • 假設(shè)4:觀測(cè)變量不存在顯著的異常值颅湘。
  • 假設(shè)5:觀測(cè)變量在各組內(nèi)接近正態(tài)分布
  • 假設(shè)6:兩組的觀測(cè)變量的方差相等闯参。

經(jīng)分析瞻鹏,本研究數(shù)據(jù)符合假設(shè)1-3鹿寨,那么應(yīng)該如何檢驗(yàn)假設(shè)4-6,并進(jìn)行獨(dú)立樣本t檢驗(yàn)?zāi)兀?/p>

三释移、SPSS操作

1. 對(duì)假設(shè)的判斷

假設(shè)4和假設(shè)5可通過(guò)以下方式來(lái)檢驗(yàn)。假設(shè)6的檢驗(yàn)結(jié)果可在結(jié)果解釋部分查看寥殖。

在主界面點(diǎn)擊Analyze→Descriptive Statistics→ Explore,彈出Explore對(duì)話框嚼贡。在對(duì)話框中將engagement變量放入Dependent List欄熏纯,并將gender變量放入 Factor List欄粤策。

點(diǎn)擊Plots樟澜,取消對(duì)Descriptive欄內(nèi) Stem-and-leaf選項(xiàng)的選擇,并點(diǎn)擊Normality plots with tests選項(xiàng)秩贰,點(diǎn)擊Continue→OK。

2. 檢驗(yàn)假設(shè)4:觀測(cè)變量不存在顯著的異常值

通過(guò)上述操作后毒费,SPSS輸出箱式圖丙唧。

一般來(lái)說(shuō)觅玻,如果研究數(shù)據(jù)中存在顯著的異常值,箱式圖會(huì)以星號(hào)或者空心圓點(diǎn)的形式提示出來(lái)溪厘。如果數(shù)據(jù)值大于1.5倍箱距胡本,數(shù)據(jù)的表示方式為空心圓點(diǎn)畸悬;如果數(shù)據(jù)值大于3倍箱距,數(shù)據(jù)的表示方式為星號(hào)傻昙。從上圖可以看出闺骚,本研究數(shù)據(jù)中沒有顯著異常值,滿足假設(shè)4僻爽。

如果箱式圖如下圖所示,則提示數(shù)組有疑似異常值贾惦。該圖提示,男性組第6位受試者的數(shù)據(jù)為疑似異常值须板,數(shù)據(jù)值大于3倍箱距碰镜。女性組的第26位受試者的數(shù)據(jù)也為疑似異常值习瑰,數(shù)據(jù)值大于1.5倍箱距绪颖。

3. 檢驗(yàn)假設(shè)5:觀測(cè)變量在各組內(nèi)接近正態(tài)分布

正態(tài)性可以使用Shapiro-Wilk檢驗(yàn)來(lái)判斷甜奄。SPSS輸出Shapiro-Wilk檢驗(yàn)結(jié)果如下圖。

一般來(lái)說(shuō)课兄,如果數(shù)據(jù)接近正態(tài)分布牍氛,那么Shapiro-Wilk檢驗(yàn)的P值就大于0.05烟阐;反之如果數(shù)據(jù)并不接近正態(tài)分布紊扬,那么Shapiro-Wilk檢驗(yàn)的P值就小于0.05。從上圖可以看出唉擂,男性/女性組內(nèi)數(shù)據(jù)接近于正態(tài)分布(P>0.05),滿足假設(shè)5楔敌。

對(duì)于正態(tài)分布的判斷啤挎,SPSS提供了多種方法卵凑,常用的有Shapiro- Wilk (W 檢驗(yàn))庆聘、Kolmogorov-Smirnov檢驗(yàn)(D檢驗(yàn))勺卢、P-P圖、Q-Q圖黑忱、其它有直方圖宴抚、箱式圖甫煞、偏度系數(shù)菇曲、峰度系數(shù)等抚吠。

Shapiro-Wilk (W 檢驗(yàn))和Kolmogorov-Smirnov檢驗(yàn)(D檢驗(yàn))
兩種檢驗(yàn)都屬于非參數(shù)檢驗(yàn)方法。SAS中規(guī)定:當(dāng)樣本含量N≤2000時(shí)楷力,結(jié)果以Shapiro-Wilk(W 檢驗(yàn))為準(zhǔn)喊式;當(dāng)樣本含量N>2000 時(shí)萧朝,結(jié)果以Kolmogorov-Smirnov(D檢驗(yàn))為準(zhǔn)。但是检柬,當(dāng)樣本量較大時(shí)献联,兩種方法的假陽(yáng)性率較高(容易得出P<0.05何址,不符合正態(tài)分布的結(jié)果酱固。

P-P圖头朱、Q-Q圖和直方圖

P-P圖以樣本的累計(jì)頻率為橫坐標(biāo)龄减,其對(duì)應(yīng)的正態(tài)分布理論累計(jì)概率作為縱坐標(biāo)畫散點(diǎn)圖。當(dāng)數(shù)據(jù)與正態(tài)分布擬合較好時(shí),圖上的點(diǎn)會(huì)大致圍繞第一象限的對(duì)角線分布烁巫。

Q-Q圖以樣本的分位數(shù)為橫坐標(biāo)署隘,其對(duì)應(yīng)的正態(tài)分布理論分位數(shù)為縱坐標(biāo)畫散點(diǎn)圖亚隙。當(dāng)數(shù)據(jù)與正態(tài)分布擬合較好時(shí)磁餐,圖上的點(diǎn)會(huì)大致圍繞第一象限的對(duì)角線分布。

也可看直方圖是否以鐘形分布來(lái)判斷(直方圖還可以選擇輸出正態(tài)性曲線)诊霹。

正態(tài)性檢驗(yàn)

W檢驗(yàn)和D檢驗(yàn)在樣本量較小時(shí),容易出現(xiàn)假陰性渣淳;樣本量過(guò)大時(shí),容易出現(xiàn)假陽(yáng)性入愧。因此對(duì)于正態(tài)性檢驗(yàn)鄙漏,因結(jié)合多種方法綜合判斷。此外怔蚌,t檢驗(yàn)對(duì)數(shù)據(jù)的正態(tài)性有一定的耐受能力。如果數(shù)據(jù)只是稍微偏離正態(tài)旁赊,結(jié)果仍然是穩(wěn)定的。如果數(shù)據(jù)偏離正態(tài)很遠(yuǎn)彤恶,則需要考慮數(shù)據(jù)轉(zhuǎn)換或采用非參數(shù)方法分析钞钙。

4. 獨(dú)立樣本t檢驗(yàn)

在主界面點(diǎn)擊Analyze→Compare Means→Independent-Samples T Test声离,在彈出的對(duì)話框中,將engagement變量放入 Test Variable(s)欄术徊,并將gender變量放入 Grouping Variable 欄本刽。

點(diǎn)擊Define Groups,在Group 1欄輸入“1”子寓,在Group 2欄輸入“2”,點(diǎn)擊Continue→OK笋除。

四、結(jié)果解釋

1. 統(tǒng)計(jì)描述
在檢驗(yàn)假設(shè)6和結(jié)果解釋之前垃它,我們需要對(duì)數(shù)據(jù)有一個(gè)基本的了解鲜屏。SPSS輸出結(jié)果如下圖。

在本研究中洛史,男性和女性組的樣本量分別是20(“N”欄)惯殊。男性組為該電視廣告打分的平均值為5.5589(“Mean”欄)也殖,標(biāo)準(zhǔn)差為0.29190(“Std. Deviation”欄)土思;女性組為該電視廣告打分的平均值為5.2999(“Mean”欄),標(biāo)準(zhǔn)差為0.39339(“Std. Deviation”欄)忆嗜。

2. 檢驗(yàn)假設(shè)6:兩組的觀測(cè)變量的方差相等

兩組的觀測(cè)變量的方差相等是進(jìn)行獨(dú)立樣本t檢驗(yàn)的必要條件。Descriptives表中顯示各組的方差值如下圖霎褐。


本研究中男性組的方差值為0.085,女性組的方差值為0.155冻璃。單從這個(gè)數(shù)據(jù)來(lái)看响谓,我們發(fā)現(xiàn)女性組的方差值幾乎是男性組的兩倍省艳,但是這僅僅是抽樣數(shù)據(jù)的方差結(jié)果娘纷,并不代表兩組數(shù)據(jù)的方差一定不等跋炕。我們需要通過(guò)Levene's檢驗(yàn),判斷兩組總體的方差情況辐烂,即大家熟知的F檢驗(yàn)遏插,如下圖纠修。


s檢驗(yàn)結(jié)果顯示,F(xiàn)=1.922扣草,P=0.174了牛,提示兩組數(shù)據(jù)方差齊辰妙,滿足假設(shè)6鹰祸。

一般來(lái)說(shuō)密浑,如果數(shù)據(jù)滿足上述假設(shè),我們就可以進(jìn)行獨(dú)立樣本t檢驗(yàn)尔破。但是如果數(shù)據(jù)滿足假設(shè)1-5街图,但是不具有等方差性,那么我們就應(yīng)該使用Mann-Whitney U檢驗(yàn)或者t’檢驗(yàn)台夺。本研究滿足假設(shè)1-6,可以進(jìn)行獨(dú)立樣本t檢驗(yàn)痴脾。

3. 獨(dú)立樣本t檢驗(yàn)
首先我們可以看到兩組數(shù)據(jù)的對(duì)比分析,如下圖標(biāo)注部分赞赖。男性組和女性組為該電視廣告打分的差值為0.25900(“Mean Difference”欄)滚朵, 95%置信區(qū)間為0.03726 到0.48074(“95% Confidence Interval of the Difference”欄)前域。

上圖中,如果Levene's檢驗(yàn)結(jié)果顯示<strong>方差齊</strong>匿垄,則讀“Equal variances assumed”行中的t檢驗(yàn)結(jié)果移宅。如果<strong>方差不齊</strong>椿疗,則需要讀“Equal variances not assumed”行中的t’檢驗(yàn)結(jié)果。

本研究中届榄,Levene's檢驗(yàn)結(jié)果顯示方差齊(F=1.922浅乔,P=0.174),t檢驗(yàn)結(jié)果顯示靖苇,t=2.365,<em>P</em>=0.023班缰,提示男性和女性為電視廣告的打分值存在統(tǒng)計(jì)學(xué)差異,即電視廣告對(duì)男性和女性的吸引力不同鲁捏。

五芯砸、撰寫結(jié)論

本研究采用獨(dú)立樣本t檢驗(yàn)判斷某電視廣告對(duì)不同性別人群吸引力的差異。研究數(shù)據(jù)不存在顯著異常值假丧,且在各組內(nèi)接近正態(tài)分布,同時(shí)方差齊动羽。結(jié)果顯示,男性對(duì)該電視廣告的打分(5.56 ± 0.29)高于女性(5.30 ± 0.39)运吓,差值為0.26(95%置信區(qū)間為0.04-0.48)渴邦。

獨(dú)立樣本t檢驗(yàn)結(jié)果提示疯趟,t = 2.365,?<em>P</em>=0.023,說(shuō)明男性和女性給該電視廣告的打分存在統(tǒng)計(jì)學(xué)差異信峻,即該電視廣告對(duì)男、女性的吸引力不同瓮床。

六、練習(xí)數(shù)據(jù)下載

作者:解琪琪
鏈接:http://www.reibang.com/u/bcb81276c29d
來(lái)源:簡(jiǎn)書
參考學(xué)習(xí)資源:怎么判別我的數(shù)據(jù)中存在特異值隘庄?教你幾招踢步!
SPSS教程:判斷數(shù)據(jù)正態(tài)分布的超多方法丑掺!
獨(dú)立樣本t檢驗(yàn) (簡(jiǎn)潔版)
簡(jiǎn)書著作權(quán)歸作者所有获印,任何形式的轉(zhuǎn)載都請(qǐng)聯(lián)系作者獲得授權(quán)并注明出處街州。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市菇肃,隨后出現(xiàn)的幾起案子地粪,更是在濱河造成了極大的恐慌琐谤,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,185評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件斗忌,死亡現(xiàn)場(chǎng)離奇詭異质礼,居然都是意外死亡织阳,警方通過(guò)查閱死者的電腦和手機(jī)眶蕉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門唧躲,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人弄痹,你說(shuō)我怎么就攤上這事饭入。” “怎么了肛真?”我有些...
    開封第一講書人閱讀 163,524評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我乾忱,道長(zhǎng)讥珍,這世上最難降的妖魔是什么窄瘟? 我笑而不...
    開封第一講書人閱讀 58,339評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮蹄葱,結(jié)果婚禮上纲酗,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好右蕊,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,387評(píng)論 6 391
  • 文/花漫 我一把揭開白布琼稻。 她就那樣靜靜地躺著饶囚,像睡著了一般。 火紅的嫁衣襯著肌膚如雪萝风。 梳的紋絲不亂的頭發(fā)上嘀掸,一...
    開封第一講書人閱讀 51,287評(píng)論 1 301
  • 那天规惰,我揣著相機(jī)與錄音睬塌,去河邊找鬼歇万。 笑死揩晴,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的贪磺。 我是一名探鬼主播,決...
    沈念sama閱讀 40,130評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼寒锚,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼劫映!你這毒婦竟也來(lái)了刹前?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,985評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤腮郊,失蹤者是張志新(化名)和其女友劉穎摹蘑,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體轧飞,經(jīng)...
    沈念sama閱讀 45,420評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡撒踪,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,617評(píng)論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了制妄。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,779評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡泵三,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出烫幕,到底是詐尸還是另有隱情俺抽,我是刑警寧澤,帶...
    沈念sama閱讀 35,477評(píng)論 5 345
  • 正文 年R本政府宣布磷斧,位于F島的核電站,受9級(jí)特大地震影響捷犹,放射性物質(zhì)發(fā)生泄漏弛饭。R本人自食惡果不足惜萍歉,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,088評(píng)論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望枪孩。 院中可真熱鬧憔晒,春花似錦蔑舞、人聲如沸丛晌。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)蜕窿。三九已至谋逻,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間毁兆,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工阴挣, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留气堕,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,876評(píng)論 2 370
  • 正文 我出身青樓揖膜,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親梅桩。 傳聞我的和親對(duì)象是個(gè)殘疾皇子壹粟,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,700評(píng)論 2 354