t分布
t分布又可以被稱為學(xué)生t分布。其由Wiliam Sealy Gosset在1908時(shí)發(fā)現(xiàn)奶甘,t分布與樣本大小n相關(guān)篷店,確切地是與自由度df=n-1相關(guān)。
t分布與正態(tài)分布相似臭家,是對(duì)稱的疲陕,但是其比正態(tài)分布寬,當(dāng)樣本數(shù)量增加钉赁,t分布會(huì)接近正態(tài)分布蹄殃。
我們可以利用R更加直觀地了解t分布:
>qt(0.025,df=29)
[1] -2.04523
> qt(0.975, df=29)
[1] 2.04523
> qt(0.05, df=29)
[1] -1.699127
> qt(0.95, df=29)
[1] 1.699127
置信區(qū)間的估計(jì)
例:Gene expression example
t29,0.025 = 2.045230, s = 1.893954, n = 30, X ? = 6.495324,求其95%置信區(qū)間
根據(jù)公式可計(jì)算得置信區(qū)間為:[5.78811, 7.202538]
例: sample 25 plants and measure their heights, if the sample mean is 15cm, with a variance of 16cm2. What is the 95% confidence interval of the population mean?
Chi-square卡方分布
若n個(gè)相互獨(dú)立的隨機(jī)變量ξ?你踩,ξ?诅岩,...,ξn ,均服從[標(biāo)準(zhǔn)正態(tài)分布](也稱獨(dú)立同分布于標(biāo)準(zhǔn)[正態(tài)分布])带膜,則這n個(gè)服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量的平方和構(gòu)成一新的隨機(jī)變量吩谦,其分布規(guī)律稱為卡方分布(chi-square distribution)。(來(lái)源:百度百科)
卡方分布不是對(duì)稱的钱慢,其與自由度df有關(guān)
對(duì)于任意的正態(tài)分布逮京,我們都能夠用Z變化將其變成標(biāo)準(zhǔn)正態(tài)分布:
如果我們使用樣本平均數(shù)取代總體平均數(shù)卿堂,我們將會(huì)失去一個(gè)自由度:
置信區(qū)間
例:Recall we randomly chose 30 genes, and compute the sample
variance s^2 = 3.587062, df =29
F分布
有兩個(gè)獨(dú)立的正態(tài)分布N(μ1,σ12)和 N(μ2,σ22).如果我們對(duì)這兩個(gè)總體進(jìn)行抽樣束莫,獲得的樣本方差為s12和s22,那么它們遵循F分布: