前一段時間給大家整體的分享了關(guān)于如何使用SPSS來進行描述性統(tǒng)計分析券敌,當時一共是分了三節(jié)內(nèi)容,不知道大家有沒有在空閑的時間好好的練習(xí)掌握一下奢赂。
在給大家分享完關(guān)于描述性統(tǒng)計分析的章節(jié)以后陪白,我們接下來會用一段時間來給大家分享一下關(guān)于如何用SPSS來進行均值比較颈走。關(guān)于均值比較在SPSS中是一個比較常見的分析方法膳灶,在這里面最常見的方法就是T檢驗,分別有單樣本T檢驗立由、獨立樣本T檢驗和配對樣本T檢驗轧钓。在學(xué)習(xí)這些檢驗方法之前,我們首選需要了解假設(shè)檢驗這個概念锐膜,因為不僅僅是在均值比較中毕箍,在后面的其他分析中我們也是隨時會用到假設(shè)檢驗的思想。
假設(shè)檢驗的理論及原理
假設(shè)某個企業(yè)生產(chǎn)一種電子元件道盏,在進行抽檢的時候而柑,企業(yè)的質(zhì)檢員說該企業(yè)的產(chǎn)品故障率只有千分之一。但是我們在檢驗的時候發(fā)現(xiàn)荷逞,從1000個電子元件中隨機拿出來了5個媒咳,調(diào)試以后發(fā)現(xiàn)其中有2個發(fā)生了故障。這說明什么呢种远?
其實涩澡,如果企業(yè)的質(zhì)檢員說的確實是正確的,那照理來說1000個電子原件中應(yīng)該只有1個會發(fā)生故障坠敷,這個我們稱之為原假設(shè)妙同。在這個情況下,我們是不可能出現(xiàn)檢驗到2個甚至2個以上的電子原件會發(fā)生故障膝迎,也就是說這種情況發(fā)生的概率應(yīng)該是0粥帚。在統(tǒng)計學(xué)中,概率極小的事件我們稱之為小概率事件限次。所以說茎辐,我們從1000個電子元件中隨機拿出來5個進行檢驗,然后其中有2個發(fā)生了故障掂恕,也就是說小概率事件發(fā)生了拖陆。所以這個時候我們的結(jié)論是質(zhì)檢員說的話是不正確的,檢驗的結(jié)果沒有支持他的判斷懊亡。
但是如果我們換一種情況依啰,在我們檢驗這1000個電子元件之前,質(zhì)檢員跟我們說這批電子元件的故障率是1%店枣,我們依然從隨機選擇的5個電子元件中發(fā)現(xiàn)有2個是出現(xiàn)故障了速警,那這個時候又說明了什么呢叹誉?其實這個時候就應(yīng)該有兩個結(jié)論:
①:這批商品的故障率遠高于1%,質(zhì)量不可靠闷旧;
②:這批商品的故障率確實是1%长豁,只是我們碰巧拿到了有故障的元件而已。
這個時候我們就應(yīng)該來進行計算忙灼,按1%的故障率來說匠襟,1000個元件就應(yīng)該有10個元件是會出現(xiàn)故障的,我們在5個里面發(fā)現(xiàn)2個產(chǎn)生了故障该园,這個情況的概率應(yīng)該是0.088%(大家可以自己計算一下)酸舍。這樣一對比,我們就會發(fā)現(xiàn)其實這是一個小概率事件而已里初。
在我們的原假設(shè)成立的條件下啃勉,如果我們分析計算出來的對應(yīng)事件概率比較大,那就不能拒絕原假設(shè)双妨。如果結(jié)果相反淮阐,那就說明小概率事件發(fā)生了。正常來說刁品,小概率事件在一次實驗中是幾乎不可能會發(fā)生的泣特,但是正常不可能發(fā)生的事件確實發(fā)生了。那么我們只能說我們的結(jié)果不能夠支持我們的假設(shè)哑诊,也就是說質(zhì)檢員1%故障率的說法也是錯誤的群扶。
上面的例子其實就是我們假設(shè)檢驗的原理:反證法以及小概率原理。反證法的意思就是說镀裤,我們在檢驗之前竞阐,先假定原假設(shè)是正確的,然后我們根據(jù)這個來得到我們的分析結(jié)論暑劝,如果我們得到的分析結(jié)論與原假設(shè)中的結(jié)論是矛盾的(根據(jù)小概率原理)骆莹,我們就可以說原假設(shè)其實是不能成立的,或者一般在分析中我們叫拒絕原假設(shè)担猛。雖然我們在做假設(shè)檢驗的時候依據(jù)是“小概率事件在一次實驗中是幾乎不可能會發(fā)生的”這個原理幕垦,但是小概率時間并不代表沒有概率,也就是說它依舊是可能發(fā)生的傅联,只是發(fā)生的概率很小而已先改。所以我們在做假設(shè)檢驗的時候會遇到兩類問題:
1.原假設(shè)是正確的,但是我們根據(jù)結(jié)果錯誤的拒絕了原假設(shè)蒸走,在這個時候這個事件出現(xiàn)的概率也就是我們出現(xiàn)問題的概率仇奶。在前面的例子中,如果第二次檢驗電子元件的合格率確實是1%比驻,但是我們認為這批元件的合格率大于1%该溯,那我們就出現(xiàn)了第一種問題岛抄,同時出現(xiàn)這個問題的概率是0.088%。
2.原假設(shè)是錯誤的狈茉,但是我們根據(jù)結(jié)果并沒有拒絕原假設(shè)夫椭,那這個事件發(fā)生的概率也就是這類問題出現(xiàn)的概率。
當我們在進行假設(shè)檢驗時氯庆,我們無法避免出現(xiàn)這兩個問題蹭秋,或者說降低出現(xiàn)這兩類問題的概率。因為如果我們降低了其中一類問題的概率点晴,那另外一類問題的概率就會隨之增加感凤。在一開始的舉例中悯周,企業(yè)是希望我們不要把無故障的元件誤判為有故障粒督,也就是說要降低企業(yè)的風(fēng)險。其實在我們實際分析中禽翼,我們在第一類問題上面會受到更多的重視屠橄,我們會想把這個情況控制在一定的水平。而這個水平我們就將它稱為顯著性水平闰挡,在分析中用α表示锐墙。一般我們以0.05或者0.01等數(shù)字來表示它(根據(jù)實際情況來進行選擇)。
正常的數(shù)據(jù)分析中长酗,假設(shè)檢驗一般是先針對總體樣本的均值溪北、比例或者分布來做出假設(shè),也就是我們說的原假設(shè)夺脾。然后我們會計算在該假設(shè)成立的前提下出現(xiàn)這種情況的概率之拨,我們將它叫做P值。如果在實驗的過程中小概率時間發(fā)生了咧叭,也就是說P<α蚀乔,那就說明結(jié)果不支持原假設(shè),我們應(yīng)該拒絕原假設(shè)菲茬。在使用SPSS的時候吉挣,將這種概率稱為顯著性的值。反之如果P>α婉弹,那我們就接受原假設(shè)睬魂。在這個里面的α是我們用來把控第一類問題出現(xiàn)的概率,也就是出現(xiàn)這一類問題的概率最大為α镀赌。
最后我們來整理一下假設(shè)檢驗的分析步驟:
1.確定分析對應(yīng)的原假設(shè)和與之對應(yīng)的備用假設(shè)氯哮。
2.選擇我們用來進行假設(shè)檢驗的對應(yīng)統(tǒng)計量。
3.對選擇出來的統(tǒng)計量進行計算并檢驗佩脊,得到P值蛙粘。
4.確定顯著性水平α垫卤。如果p<α,拒絕原假設(shè)出牧。反之穴肘,接受原假設(shè)。
在我們的實際分析中舔痕,許多時候我們進行假設(shè)檢驗都是用來比較兩個總體的均值评抚。并且均值的比較在許多研究中都特別常見,應(yīng)用也特別廣泛伯复。今天我們先整理了解假設(shè)檢驗的理論和原理慨代,可能看起來會有一點繞,大家一定要多思考啸如,這樣的話我們對接下來的均值分析以及T檢驗的分析大家在理解的時候就不會有太大的問題了侍匙。
歡迎大家進行補充,大家可以在我們的QQ交流群(514581193)或者微信群中(關(guān)注小白數(shù)據(jù)營公眾號后臺留言進入)參與討論和交流叮雳。