一只锭、問(wèn)題與數(shù)據(jù)
某廣告公司制作了一段電視宣傳視頻,希望能夠同時(shí)吸引男性和女性購(gòu)買者的注意≡憾現(xiàn)該公司共招募20位男性和20位女性研究對(duì)象,請(qǐng)他們觀看電視宣傳視頻后為視頻評(píng)分邀摆,并根據(jù)兩組分?jǐn)?shù)對(duì)比判斷男纵顾、女受試者對(duì)該視頻的喜好程度隧熙。他們收集了研究對(duì)象的性別(gender)和評(píng)分(engagement)。
二、對(duì)問(wèn)題分析
研究者擬分析兩組數(shù)據(jù)均值是否有差異音念,即根據(jù)兩組的評(píng)分沪饺,判斷男性和女性對(duì)該視頻的喜好程度闷愤。針對(duì)這種情況,我們可以使用獨(dú)立樣本t檢驗(yàn)讥脐,但需要先滿足6項(xiàng)假設(shè):
- 假設(shè)1:觀測(cè)變量為連續(xù)變量遭居,如本研究中的評(píng)分為連續(xù)變量旬渠。
- 假設(shè)2:觀測(cè)變量分為2組,如本研究中分為男性組和女性組告丢。
- 假設(shè)3:觀測(cè)值之間相互獨(dú)立枪蘑,如本研究中各位研究對(duì)象的信息都是獨(dú)立的岖免,不存在相互干擾岳颇。
- 假設(shè)4:觀測(cè)變量不存在顯著的異常值颅湘。
- 假設(shè)5:觀測(cè)變量在各組內(nèi)接近正態(tài)分布。
- 假設(shè)6:兩組的觀測(cè)變量的方差相等闯参。
經(jīng)分析瞻鹏,本研究數(shù)據(jù)符合假設(shè)1-3鹿寨,那么應(yīng)該如何檢驗(yàn)假設(shè)4-6,并進(jìn)行獨(dú)立樣本t檢驗(yàn)?zāi)兀?/p>
三释移、SPSS操作
1. 對(duì)假設(shè)的判斷
假設(shè)4和假設(shè)5可通過(guò)以下方式來(lái)檢驗(yàn)。假設(shè)6的檢驗(yàn)結(jié)果可在結(jié)果解釋部分查看寥殖。
在主界面點(diǎn)擊Analyze→Descriptive Statistics→ Explore,彈出Explore對(duì)話框嚼贡。在對(duì)話框中將engagement變量放入Dependent List欄熏纯,并將gender變量放入 Factor List欄粤策。
點(diǎn)擊Plots樟澜,取消對(duì)Descriptive欄內(nèi) Stem-and-leaf選項(xiàng)的選擇,并點(diǎn)擊Normality plots with tests選項(xiàng)秩贰,點(diǎn)擊Continue→OK。
2. 檢驗(yàn)假設(shè)4:觀測(cè)變量不存在顯著的異常值
通過(guò)上述操作后毒费,SPSS輸出箱式圖丙唧。
一般來(lái)說(shuō)觅玻,如果研究數(shù)據(jù)中存在顯著的異常值,箱式圖會(huì)以星號(hào)或者空心圓點(diǎn)的形式提示出來(lái)溪厘。如果數(shù)據(jù)值大于1.5倍箱距胡本,數(shù)據(jù)的表示方式為空心圓點(diǎn)畸悬;如果數(shù)據(jù)值大于3倍箱距,數(shù)據(jù)的表示方式為星號(hào)傻昙。從上圖可以看出闺骚,本研究數(shù)據(jù)中沒有顯著異常值,滿足假設(shè)4僻爽。
如果箱式圖如下圖所示,則提示數(shù)組有疑似異常值贾惦。該圖提示,男性組第6位受試者的數(shù)據(jù)為疑似異常值须板,數(shù)據(jù)值大于3倍箱距碰镜。女性組的第26位受試者的數(shù)據(jù)也為疑似異常值习瑰,數(shù)據(jù)值大于1.5倍箱距绪颖。
3. 檢驗(yàn)假設(shè)5:觀測(cè)變量在各組內(nèi)接近正態(tài)分布
正態(tài)性可以使用Shapiro-Wilk檢驗(yàn)來(lái)判斷甜奄。SPSS輸出Shapiro-Wilk檢驗(yàn)結(jié)果如下圖。
一般來(lái)說(shuō)课兄,如果數(shù)據(jù)接近正態(tài)分布牍氛,那么Shapiro-Wilk檢驗(yàn)的P值就大于0.05烟阐;反之如果數(shù)據(jù)并不接近正態(tài)分布紊扬,那么Shapiro-Wilk檢驗(yàn)的P值就小于0.05。從上圖可以看出唉擂,男性/女性組內(nèi)數(shù)據(jù)接近于正態(tài)分布(P>0.05),滿足假設(shè)5楔敌。
對(duì)于正態(tài)分布的判斷啤挎,SPSS提供了多種方法卵凑,常用的有Shapiro- Wilk (W 檢驗(yàn))庆聘、Kolmogorov-Smirnov檢驗(yàn)(D檢驗(yàn))勺卢、P-P圖、Q-Q圖黑忱、其它有直方圖宴抚、箱式圖甫煞、偏度系數(shù)菇曲、峰度系數(shù)等抚吠。
Shapiro-Wilk (W 檢驗(yàn))和Kolmogorov-Smirnov檢驗(yàn)(D檢驗(yàn))
兩種檢驗(yàn)都屬于非參數(shù)檢驗(yàn)方法。SAS中規(guī)定:當(dāng)樣本含量N≤2000時(shí)楷力,結(jié)果以Shapiro-Wilk(W 檢驗(yàn))為準(zhǔn)喊式;當(dāng)樣本含量N>2000 時(shí)萧朝,結(jié)果以Kolmogorov-Smirnov(D檢驗(yàn))為準(zhǔn)。但是检柬,當(dāng)樣本量較大時(shí)献联,兩種方法的假陽(yáng)性率較高(容易得出P<0.05何址,不符合正態(tài)分布的結(jié)果酱固。
P-P圖头朱、Q-Q圖和直方圖
P-P圖以樣本的累計(jì)頻率為橫坐標(biāo)龄减,其對(duì)應(yīng)的正態(tài)分布理論累計(jì)概率作為縱坐標(biāo)畫散點(diǎn)圖。當(dāng)數(shù)據(jù)與正態(tài)分布擬合較好時(shí),圖上的點(diǎn)會(huì)大致圍繞第一象限的對(duì)角線分布烁巫。
Q-Q圖以樣本的分位數(shù)為橫坐標(biāo)署隘,其對(duì)應(yīng)的正態(tài)分布理論分位數(shù)為縱坐標(biāo)畫散點(diǎn)圖亚隙。當(dāng)數(shù)據(jù)與正態(tài)分布擬合較好時(shí)磁餐,圖上的點(diǎn)會(huì)大致圍繞第一象限的對(duì)角線分布。
也可看直方圖是否以鐘形分布來(lái)判斷(直方圖還可以選擇輸出正態(tài)性曲線)诊霹。
正態(tài)性檢驗(yàn)
W檢驗(yàn)和D檢驗(yàn)在樣本量較小時(shí),容易出現(xiàn)假陰性渣淳;樣本量過(guò)大時(shí),容易出現(xiàn)假陽(yáng)性入愧。因此對(duì)于正態(tài)性檢驗(yàn)鄙漏,因結(jié)合多種方法綜合判斷。此外怔蚌,t檢驗(yàn)對(duì)數(shù)據(jù)的正態(tài)性有一定的耐受能力。如果數(shù)據(jù)只是稍微偏離正態(tài)旁赊,結(jié)果仍然是穩(wěn)定的。如果數(shù)據(jù)偏離正態(tài)很遠(yuǎn)彤恶,則需要考慮數(shù)據(jù)轉(zhuǎn)換或采用非參數(shù)方法分析钞钙。
4. 獨(dú)立樣本t檢驗(yàn)
在主界面點(diǎn)擊Analyze→Compare Means→Independent-Samples T Test声离,在彈出的對(duì)話框中,將engagement變量放入 Test Variable(s)欄术徊,并將gender變量放入 Grouping Variable 欄本刽。
點(diǎn)擊Define Groups,在Group 1欄輸入“1”子寓,在Group 2欄輸入“2”,點(diǎn)擊Continue→OK笋除。
四、結(jié)果解釋
1. 統(tǒng)計(jì)描述
在檢驗(yàn)假設(shè)6和結(jié)果解釋之前垃它,我們需要對(duì)數(shù)據(jù)有一個(gè)基本的了解鲜屏。SPSS輸出結(jié)果如下圖。
在本研究中洛史,男性和女性組的樣本量分別是20(“N”欄)惯殊。男性組為該電視廣告打分的平均值為5.5589(“Mean”欄)也殖,標(biāo)準(zhǔn)差為0.29190(“Std. Deviation”欄)土思;女性組為該電視廣告打分的平均值為5.2999(“Mean”欄),標(biāo)準(zhǔn)差為0.39339(“Std. Deviation”欄)忆嗜。
2. 檢驗(yàn)假設(shè)6:兩組的觀測(cè)變量的方差相等
兩組的觀測(cè)變量的方差相等是進(jìn)行獨(dú)立樣本t檢驗(yàn)的必要條件。Descriptives表中顯示各組的方差值如下圖霎褐。
本研究中男性組的方差值為0.085,女性組的方差值為0.155冻璃。單從這個(gè)數(shù)據(jù)來(lái)看响谓,我們發(fā)現(xiàn)女性組的方差值幾乎是男性組的兩倍省艳,但是這僅僅是抽樣數(shù)據(jù)的方差結(jié)果娘纷,并不代表兩組數(shù)據(jù)的方差一定不等跋炕。我們需要通過(guò)Levene's檢驗(yàn),判斷兩組總體的方差情況辐烂,即大家熟知的F檢驗(yàn)遏插,如下圖纠修。
s檢驗(yàn)結(jié)果顯示,F(xiàn)=1.922扣草,P=0.174了牛,提示兩組數(shù)據(jù)方差齊辰妙,滿足假設(shè)6鹰祸。
一般來(lái)說(shuō)密浑,如果數(shù)據(jù)滿足上述假設(shè),我們就可以進(jìn)行獨(dú)立樣本t檢驗(yàn)尔破。但是如果數(shù)據(jù)滿足假設(shè)1-5街图,但是不具有等方差性,那么我們就應(yīng)該使用Mann-Whitney U檢驗(yàn)或者t’檢驗(yàn)台夺。本研究滿足假設(shè)1-6,可以進(jìn)行獨(dú)立樣本t檢驗(yàn)痴脾。
3. 獨(dú)立樣本t檢驗(yàn)
首先我們可以看到兩組數(shù)據(jù)的對(duì)比分析,如下圖標(biāo)注部分赞赖。男性組和女性組為該電視廣告打分的差值為0.25900(“Mean Difference”欄)滚朵, 95%置信區(qū)間為0.03726 到0.48074(“95% Confidence Interval of the Difference”欄)前域。
上圖中,如果Levene's檢驗(yàn)結(jié)果顯示<strong>方差齊</strong>匿垄,則讀“Equal variances assumed”行中的t檢驗(yàn)結(jié)果移宅。如果<strong>方差不齊</strong>椿疗,則需要讀“Equal variances not assumed”行中的t’檢驗(yàn)結(jié)果。
本研究中届榄,Levene's檢驗(yàn)結(jié)果顯示方差齊(F=1.922浅乔,P=0.174),t檢驗(yàn)結(jié)果顯示靖苇,t=2.365,<em>P</em>=0.023班缰,提示男性和女性為電視廣告的打分值存在統(tǒng)計(jì)學(xué)差異,即電視廣告對(duì)男性和女性的吸引力不同鲁捏。
五芯砸、撰寫結(jié)論
本研究采用獨(dú)立樣本t檢驗(yàn)判斷某電視廣告對(duì)不同性別人群吸引力的差異。研究數(shù)據(jù)不存在顯著異常值假丧,且在各組內(nèi)接近正態(tài)分布,同時(shí)方差齊动羽。結(jié)果顯示,男性對(duì)該電視廣告的打分(5.56 ± 0.29)高于女性(5.30 ± 0.39)运吓,差值為0.26(95%置信區(qū)間為0.04-0.48)渴邦。
獨(dú)立樣本t檢驗(yàn)結(jié)果提示疯趟,t = 2.365,?<em>P</em>=0.023,說(shuō)明男性和女性給該電視廣告的打分存在統(tǒng)計(jì)學(xué)差異信峻,即該電視廣告對(duì)男、女性的吸引力不同瓮床。
六、練習(xí)數(shù)據(jù)下載
作者:解琪琪
鏈接:http://www.reibang.com/u/bcb81276c29d
來(lái)源:簡(jiǎn)書
參考學(xué)習(xí)資源:怎么判別我的數(shù)據(jù)中存在特異值隘庄?教你幾招踢步!
SPSS教程:判斷數(shù)據(jù)正態(tài)分布的超多方法丑掺!
獨(dú)立樣本t檢驗(yàn) (簡(jiǎn)潔版)
簡(jiǎn)書著作權(quán)歸作者所有获印,任何形式的轉(zhuǎn)載都請(qǐng)聯(lián)系作者獲得授權(quán)并注明出處街州。