學術(shù)研究中,通過問卷收集數(shù)據(jù)扔涧,進行分析的情況越來越多届谈。但在問卷收集數(shù)據(jù)時艰山,難免會出現(xiàn)填寫者亂填,或者不知道如何填寫等摔吏,最終導致收集數(shù)據(jù)不準確纵装,研究結(jié)論不可靠等問題。
如果問卷收集數(shù)據(jù)不準確诗箍,通常會帶來數(shù)據(jù)信度和效度的影響扳还。單獨從肉眼看數(shù)據(jù)都挺正常橱夭,但使用研究方法進行測量就會立刻現(xiàn)出原形。
學術(shù)研究上使用量表居多俏让,而且也只有量表也才能進行信度和效度測量首昔,數(shù)據(jù)的信度即可靠性是最為基礎(chǔ)糙俗,同時數(shù)據(jù)的有效性也是數(shù)據(jù)質(zhì)量的基本要求。研究者可通過SPSSAU問卷研究模塊進行信度和效度測量赊颠。
既然數(shù)據(jù)問題會帶來信度和效度問題竣蹦,那應該如何防范呢,出現(xiàn)問題時又如何解決呢长窄?本文從兩個部分進行闡述挠日,如何保證數(shù)據(jù)質(zhì)量驰后。
一灶芝、防范無效樣本
首先從防范的角度來看,從問卷設(shè)計和問卷收集兩個角度提供以下六點建議:
1. 題目不能過多
題目過多會導致填寫者不耐煩,越到后面的問題越不準確女器,如果是學術(shù)研究驾胆,通常有一個標準是測量變量的5倍左右,比如測量變量有10個入桂,每個測量變量通常對應4~7個題驳阎,那么加起來共有50個題左右呵晚,除此之外再加上一些基本的個人信息題和一些樣本行為特征題即可。因此如果研究越復雜撮珠,研究變量越多金矛,那么問卷設(shè)計的題目也會越多,對于收集數(shù)據(jù)的質(zhì)量控制也應該越高;問卷設(shè)計時不是題越多越好废睦,而應該以剛好匹配研究目的為準嗜湃。
2. 設(shè)置測謊題
問卷設(shè)計時可加入個別測謊題,此種做法的好處是可以在后續(xù)處理時很好的進行識別出無效樣本杖挣,快速地檢查出樣本是否真實回答問卷刚陡。
3. 問卷整體規(guī)范
比如問卷設(shè)計時措詞表達的簡潔易懂筐乳,問卷結(jié)構(gòu)的清晰簡單,問卷是給用戶填寫使用的氓皱,一定需要站在填寫問卷人的角度進行換角度考慮勃刨,設(shè)計出結(jié)構(gòu)清晰簡單易懂的問卷身隐,別人也更加愿意為你填寫抡医。
4. 互填問卷需謹慎
問卷研究時樣本數(shù)量一般要求是量表題的5倍,嚴格是10倍大脉。比如問卷中有40道量表題水孩,那至少需要200個樣本才適合镰矿。問卷設(shè)計好后,通常是讓朋友同學進行填寫俘种,但是數(shù)量有限秤标,還是不夠绝淡,所以現(xiàn)在出現(xiàn)較多的問卷互填QQ群,陌生人幫助填寫等苍姜,陌生人為你填寫牢酵,也沒有利益問題,所以此類樣本的準確度沒辦法保證衙猪,因此在問卷設(shè)計時有個測謊題就可以用于后面的識別。
?
5. 收費樣本需謹慎
當前有比較多的問卷網(wǎng)站提供樣本收集服務垫释,如果使用此類服務丝格,建議自己設(shè)置一些測謊題用于判斷是否真實有效的樣本。
6. 問卷預測試
上述已經(jīng)說明棵譬,問卷是否真實可靠显蝌,是否有效,肉眼根本無法識別订咸,但是使用分析方法一下子就能看出曼尊。因此一般可以先收集小部分(比如50個)數(shù)據(jù)后,進行預測試分析算谈,一般是做信度分析涩禀,大概看下效度分析情況。先做到心中有數(shù)然眼,如果預測試出現(xiàn)大的問題艾船,提前發(fā)現(xiàn)問題,修改一些問卷規(guī)范高每,重新找有效的樣本等屿岂。
二、無效樣本處理
?
上述六種辦法鲸匿,已經(jīng)做好各種防范爷怀,相信問卷中無效樣本已經(jīng)非常少,余下的都是有效樣本了带欢。但實際上并非如此运授,比如說會出現(xiàn)這樣的樣本,很多個量表題都選擇同一個答案(比如‘同意’)乔煞。也或者填空年齡吁朦,結(jié)果出現(xiàn)一個數(shù)字110。類似這樣的都屬于無效渡贾,應該進行處理逗宜。
如果對無效樣本不進行處理,肯定會導致分析出現(xiàn)問題。因此在做好各種防范后纺讲,還需要在數(shù)據(jù)收集完成后對數(shù)據(jù)無效性進行處理擂仍。接下來以SPSSAU無效樣本和異常值處理這兩個功能進行說明。
1.無效樣本
首先找到SPSSAU提供的無效樣本處理功能熬甚。數(shù)據(jù)處理》無效樣本逢渔,如下圖:
SPSSAU提供兩種情況的無效樣本設(shè)置:第一種是完全相同數(shù)字超過一定比例時設(shè)置成無效樣本。不認真填寫者通常有個特別是完全選擇相同的答案乡括,一般以量表題選擇相同數(shù)字超過70%作為標準复局。
性別、學歷這種是樣本本身的屬性粟判,到底是男還是女,無法測試峦剔。所以一般選中問卷中的所有量表題档礁,比如30道題表題,30個量表題中70%都是相同數(shù)字吝沫,意味著21個題都選擇同樣一個答案呻澜,這種一般就算無效樣本。這里70%是常見處理方式惨险,當然也可以設(shè)置成60%或者80%的標準羹幸。
除了相同數(shù)字識別成無效樣本,SPSSAU還提供缺失樣本比例超過某數(shù)字后辫愉,也設(shè)置成無效樣本栅受。如果一大堆答案都不選擇,那肯定也屬于無效恭朗。具體有多少比例的答案沒有做出回答算成無效屏镊,沒有固定的標準,一般70%以上肯定是無效樣本痰腮。
設(shè)置好無效樣本后而芥,默認會新生成一個標題,用來標識那些樣本是有效膀值,那些是無效棍丐,在分析的時候直接進行篩選下就好。
2.異常值
除上述無效樣本外沧踏,還有一種情況是異常值也需要特別注意歌逢,比如有一個題是問年齡,樣本回答為1歲悦冀,那肯定這個數(shù)字是有問題的趋翻,有可能填寫者沒有看清楚,也或者看清楚了寫錯了,也可能亂填踏烙,都有可能师骗。
無論如何,當出現(xiàn)此種情況下都需要進行處理讨惩。SPSSAU數(shù)據(jù)處理里面的異常值功能可進行設(shè)置辟癌,并且提供多種選項處理方式等,如下圖:
異常值的判斷標準上荐捻,可按數(shù)字為null即‘缺失數(shù)字’當成是異常值黍少,也可以設(shè)置在某個范圍的數(shù)字(比如年齡大于100或小于0)為異常值,當然還有一種標準是數(shù)據(jù)超過3個標準差當成異常值处面。
異常值標準設(shè)定后厂置,具體如何處理,正常情況下是設(shè)置成null值魂角。當然也可以考慮進行填補昵济,用正常的數(shù)據(jù)特征(比如平均值)去填補異常數(shù)據(jù)。具體情況視研究者偏好而定野揪,沒有固定的標準访忿。
本文針對問卷無效樣本的防范,以及通過SPSSAU對無效樣本進行處理進行說明斯稳。除此之外還特別提示大家海铆,如果問卷是量表題,多做信度和效度分析等挣惰,利用科學的研究方法進行分析卧斟,這樣才具有說服力,數(shù)據(jù)是否真實可靠憎茂,問卷設(shè)計是否規(guī)范唆涝,不是個人說了算,而是通過科學的研究結(jié)論進行論證唇辨。
更多內(nèi)容歡迎登陸SPSSAU官網(wǎng)查看廊酣。