比率的標(biāo)準(zhǔn)誤差是基于二項分布吧趣,因為一個比率通常是成功次數(shù)除以試驗次數(shù)羹铅。二項分布的方差可以用下面的公式表示:Var(X) = np(1-p)
其中 ( n ) 是試驗的總次數(shù)股缸,( p ) 是每次試驗成功的概率。如果 ( X ) 是一個二項隨機變量(即充岛,模型成功次數(shù)的分布),那么 ( X ) 的期望值和方差如下:
E(X) = np?
Var(X) = np(1-p)?
為了得到比率的方差耕蝉,我們首先定義一個比率 p= X/n崔梗。比率的標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)誤)是這個比率方差的平方根:
Var(p) = Var(X/n) =Var(X)?/n^2
Var(p) =?=Var(X)?/n^2 = np(1-p)?/n^2=p(1-p)?/n
上述推導(dǎo)使用了方差的性質(zhì),即一個隨機變量乘以常數(shù) ( a ) 時垒在,方差乘以 ( a^2 )蒜魄。
需要注意的是,這個標(biāo)準(zhǔn)誤差的公式適用于比率而不直接適用于比率比或風(fēng)險比场躯。此外谈为,這種近似在樣本量足夠大時有效,但是在樣本量較小時踢关,比率的分布可能不再近似于正態(tài)分布伞鲫,這時可能需要使用不同的方法(如,使用正態(tài)近似的修正或者精確統(tǒng)計方法如Fisher確切檢驗)來得到更精確的置信區(qū)間或標(biāo)準(zhǔn)誤差計算签舞。