?今天我們學習的是兩獨立樣本t檢驗的思想和實際操作蝶缀,其實在某些方面來看扩借,獨立樣本t檢驗更像是單樣本t檢驗的一種延伸。
為了方便對比贱鄙,依舊選取前面單樣本t檢驗提到過的案例劝贸。我們檢測從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數為130.83g/L逗宁,標準差為25.74g/L映九,如果我們知道正常成年男性的血紅蛋白含量均數是140g/L,想要知道鉛作業(yè)男性工人的血紅蛋白含量是否與正常成年男性不同瞎颗,就是采用單樣本t檢驗件甥。但此時捌议,如果正常成年男性的血紅蛋白含量未知,我們必須再找一批正常成年男性作為樣本引有,以兩個人群的樣本進行比較瓣颅,進而推斷其代表的總體是否有差異,這就是兩獨立樣本t檢驗譬正。
概念:
兩獨立樣本t檢驗是在兩個未知總體中抽取部分樣本宫补,通過統計推斷,看兩總體之間是否存在差異曾我。
疑惑:
其實對于很多初學者來說粉怕,他們最大疑惑就是,為什么不能通過兩個樣本的數據直接比較抒巢,得出誰高誰低不就行了贫贝?用得著比較其對應的總體之間的差異么?有這種問題這就是還沒有真正弄懂統計的含義虐秦。
比如上面的例子平酿,鉛作業(yè)男性工人的血紅蛋白含量均數為130.83g/L,正常成年男性的血紅蛋白含量均數是140g/L悦陋,一比較就能得出工人<正常人蜈彼。但是要知道一個地區(qū)或者全國的鉛作業(yè)工人數量巨大,正常人數量就更別說了俺驶,我們現在能獲取的僅僅是這兩大總體中的一小部分幸逆,如果只比較兩個樣本,難免不會讓人信服暮现,因為如果恰好抽到一部分正常人的血紅蛋白較低还绘,豈不是得到了與真實情況相反的結局,所以必須要考慮到抽樣誤差的存在栖袋。
抽樣:
實際工作中拍顷,抽取樣本通常有兩種形式:
1、隨機分組塘幅,隨機分成兩組昔案,分別接受兩種不同的處理
2、按某種屬性分組电媳,比如按性別分兩組踏揣,分別接受兩種不同的處理
總之不管怎么分,必須保證兩組相互獨立匾乓,不受影響捞稿。
使用條件:
一、兩組樣本必須是連續(xù)型變量
二、兩組觀測值相互獨立
三娱局、不存在明顯異常值
四彰亥、服從正態(tài)分布或近似正態(tài)分布
五、方差齊
案例演示:(選自第4版 醫(yī)學統計學)
實際操作:
一铃辖、異常值檢查
圖形-圖形構建器-箱圖-數值變量放入Y軸剩愧,分組變量放入X軸
由圖可知,并無異常值娇斩。
二仁卷、檢驗正態(tài)性
兩組樣本均通過了正態(tài)性檢驗,可以進行獨立樣本t檢驗犬第。不管是哪一類型的t檢驗锦积,對數據的正態(tài)性要求都不是很嚴格,只要不是太偏歉嗓,一般用t檢驗的方法效果都好于非參方法丰介。
三、獨立樣本t檢驗
一鉴分、統計描述結果顯示哮幢,拜糖平組降壓效果優(yōu)于阿卡波糖組,究竟是真實情況還是抽樣誤差志珍,看接下來的統計推斷橙垢。
二、看t檢驗之前伦糯,首先觀察兩組樣本的方差齊不齊柜某。結果顯示P>0.05,由于H0:兩組樣本的方差齊敛纲,所以不能拒絕原假設喂击。我們只需要看假定等方差那一行的數據就行;如果不齊淤翔,看下面不假定等方差那一行翰绊,因為軟件已經為我們進行了校正。
在這我將介紹一個重要概念旁壮,為什么獨立樣本t檢驗必須要求方差齊辞做,校正的含義是什么?
如果兩組樣本方差不齊寡具,意味著這兩組壓根就不是一個量級,比較沒意義(比如我們比較男女肺活量有無差異稚补,這樣的比較有意義么童叠?男女的生理結構都不一致,同等年齡的綜合水平下,男性肯定>女性)厦坛,但結果我們還得看五垮,所以看下面校正過的t’檢驗。
怎么去理解校正呢杜秸?
(比如男性就是比女性肺活量大放仗,所以我們直接比較沒意義,此時我們調整一下撬碟,讓男生吹的時候吹一半或者2/3诞挨,女生全力吹)將一個樣本校正到與另一個樣本可比的水平,就是校正的意義呢蛤。
三惶傻、方差齊,就看第一行的結果其障,P>0.05银室,還不能拒絕原假設,尚不能說明兩組藥在降糖效果方面存在差異励翼,因為有可能存在抽樣誤差蜈敢。
t檢驗的內容目前基本就學習完了(有些細節(jié)的我會隨時補充),下一篇我會寫為什么在使用t檢驗的時候要報告效應量指標汽抚?因為在我們投稿過程中抓狭,某些比較嚴格的雜志社會要求作者在使用t檢驗結果后面附帶效應量指標,所以學習還是很有必要的殊橙。
之后我并不想按照傳統統計書大綱接下來學習方差分析的內容辐宾,咱既然學習t檢驗,就要把t檢驗相關的都學個明白膨蛮,直接開始學習非參數檢驗的方法叠纹,以應對不滿足t檢驗的使用條件的情況。拜拜敞葛。