預備知識
這里提到的內容可能在其他筆記中有出現(xiàn)炮叶,但是考慮到重復能夠加深記憶渡处,就這樣吧祟辟。
隨機變量之差的方差
已知條件:
川尖。
另有隨機變量,那么有:
這是很好理解的,相當于兩個色子的點數(shù)相加后的期望馍悟,當然是每個色子期望之和剩晴。類似的,還有毅整。
比較不那么顯然是方差的情況绽左,這里作一個簡單說明:
這里的相當于是把隨機變量的值累加再減去均值的累加拼窥,結果當然是0鲁纠。因此第三項前面無論是正號還是負號,都不影響結果情龄,因此我們可以說:
結論:隨機變量之差(和)的方差為這些隨機變量方差之和捍壤。
順便看一下相反數(shù)的情況:
結論:隨機變量與其相反數(shù)方差相等。
樣本均值之差的分布
已知條件:
有兩個隨機變量的某種分布尚胞,不一定是正態(tài)分布笼裳。但是根據(jù)中心極限定理,我們可以確定它們的樣本均值的抽樣分布符合正態(tài)分布拜轨。
不過這里先假設允青。
關于抽樣分布的參數(shù):
均值:根據(jù)中心極限定理,其均值和總體相同法牲,即琼掠。
方差:瓷蛙,
為樣本的大小。
證明:
樣本中的元素假設都是獨立的横堡」谔遥可以理解把一次抽n個變成每次抽一個,抽n次(有放回地抽忍酌础)碳蛋。因此
都等于總體標準差肃弟。記該樣本的均值為
穷缤。
現(xiàn)在來看樣本均值之差的分布津肛,為了方便汗贫,記這個差值為隨機變量:
均值之差的置信區(qū)間
在不同的場合下,置信區(qū)間有不同的用法摊唇,這里用于均值之差涯鲁。
有這樣一個實驗:實驗組食用低脂肪食物抹腿,對照組食用等量非低脂肪食物。均為100人幢踏,一段時間后房蝉,實驗組體重減少的均值為9.31微渠,標準差4.67。對照組體重減少的均值為7.40檀蹋,標準差4.04云芦。(假定這里的標準差是無偏的)
由于我們要看的是該種減肥方式對所有人總體的效果舅逸,因此測試這部分人只能算作樣本,現(xiàn)在坠七,我們是在通過樣本估計總體旗笔。大部分實驗都是這個基本思路。
為了判斷低脂肪食物是否真的有減肥作用拳魁,我們來觀察差值的分布情況撮弧。其中,
是實驗組的隨機變量卦尊,
是對照組的隨機變量岂却。
從抽樣的情況看,均值相差:9.31 - 7.40 = 1.91署浩,看起來低脂肪食物是有效的扫尺。我們進一步通過置信區(qū)間來明確這個有效的程度正驻。
(這里
)
但是我們不知道總體的方差襟交。但是我們可以通過一次抽樣的無偏估計來估算總體的方差捣域。因此繼續(xù):
于是。
假如我們選擇95%置信區(qū)間贞言,它的含義就是說逐样,大約在100次抽樣中,有95次這個差值會命中我們的這個區(qū)間挪捕。那么怎么算這個區(qū)間呢级零?
我們已經計算出的分布了,也就是假如我們抽樣非常多次鉴嗤,最后的
的概率密度曲線就是我們所計算的那個正態(tài)分布的曲線。那么要有95%的命中率序调,我們當然就應該讓這個區(qū)間對應的曲線下的面積為95%醉锅。
查表可得:在區(qū)間之間的面積是95%,那么我們可以算出:
于是我們的置信區(qū)間就是 发绢,即
硬耍。可以看出边酒,在95%的置信水平下经柴,下限也是一個正值,即實驗組的減肥效果優(yōu)于對照組墩朦。我們的結論是:該方案有效坯认。