統(tǒng)計(jì)(十)_自助法

對于正態(tài)分布或其他已知分布的數(shù)據(jù)喉脖,有相應(yīng)的假設(shè)檢驗(yàn)與置信區(qū)間的計(jì)算方法况鸣,但是當(dāng)數(shù)據(jù)抽樣自未知或混合分布何乎、樣本量過小昔搂、存在離群點(diǎn)玲销、基于理論分布設(shè)計(jì)合適的統(tǒng)計(jì)檢驗(yàn)過于復(fù)雜且數(shù)學(xué)上難以處理等情況,就需要使用基于隨機(jī)化和重抽樣的統(tǒng)計(jì)方法摘符。

上次推文主要我們介紹了置換檢驗(yàn)贤斜,本次推文主要介紹自助法。

自助法

自助法逛裤,即從初始樣本重復(fù)隨機(jī)替換抽樣瘩绒,生成一個(gè)或一系列待檢驗(yàn)統(tǒng)計(jì)量的經(jīng)驗(yàn)分布,無需假設(shè)一個(gè)特定的理論分布带族,便可生成統(tǒng)計(jì)量的置信區(qū)間锁荔,并能檢驗(yàn)統(tǒng)計(jì)假設(shè)。

簡單來講蝙砌,自助法就是不依賴變量具體分布形式計(jì)算置信區(qū)間的方法阳堕。

自助法步驟:(以下引自R語言實(shí)戰(zhàn))

(1)從樣本中隨機(jī)選擇10個(gè)觀測,抽樣后再放回择克。有些觀測可能會被選擇多次恬总,有些可能一直都不會被選中;

(2)計(jì)算并記錄樣本均值肚邢;

(3)重復(fù)1和2一千次越驻;

(4)將1000個(gè)樣本均值從小到大排序;

(5)找出樣本均值2.5%和97.5%的分位點(diǎn)道偷,此時(shí)即初始位置和最末位置的第25個(gè)數(shù)缀旁,它們就限定了95%的置信區(qū)間。

針對不服從正態(tài)分布的樣本均值勺鸦,自助法的優(yōu)勢十分明顯并巍,因此常用于潛在分布未知、出現(xiàn)離群值换途、樣本量過小懊渡、沒有可選的參數(shù)方法等情況。

對單個(gè)統(tǒng)計(jì)量使用自助法

rsq<-function(formula,data,indices){
  d<-data[indices,]
  fit<-lm(formula,data=d)
  return(summary(fit)$r.square)
}
library(boot)
set.seed(1234)
results<-boot(data=mtcars,statistic=rsq,R=1000,formula=mpg~wt+disp)
print(results)
## 
## ORDINARY NONPARAMETRIC BOOTSTRAP
## 
## 
## Call:
## boot(data = mtcars, statistic = rsq, R = 1000, formula = mpg ~ 
##     wt + disp)
## 
## 
## Bootstrap Statistics :
##      original     bias    std. error
## t1* 0.7809306 0.01379126  0.05113904
plot(results)
image.png
#計(jì)算95%的置信區(qū)間
boot.ci(results,type=c("perc","bca"))
## BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
## Based on 1000 bootstrap replicates
## 
## CALL : 
## boot.ci(boot.out = results, type = c("perc", "bca"))
## 
## Intervals : 
## Level     Percentile            BCa          
## 95%   ( 0.6753,  0.8835 )   ( 0.6344,  0.8561 )  
## Calculations and Intervals on Original Scale
## Some BCa intervals may be unstable

我們來分析一下這段代碼:

首先军拟,我們定義了一個(gè)rsq函數(shù)剃执,這個(gè)函數(shù)表示對于formula計(jì)算R方值。此處主要需要修改的代碼是 return(summary(fit)$r.square)

其次懈息,我們進(jìn)行自主法肾档,重復(fù)1000次。此處主要需要修改的代碼是data和formula

最后,計(jì)算95%置信區(qū)間怒见,使用“perc”和“bca”的方法俗慈。

從圖中,我們可以看出自助的R方不呈正態(tài)分布遣耍。

依據(jù)分位數(shù)法計(jì)算置信區(qū)間:Percentile( 0.6753, 0.8835 )

依據(jù)偏差對置信區(qū)間進(jìn)行調(diào)整:BCa ( 0.6344, 0.8561 )

對多個(gè)統(tǒng)計(jì)量使用自助法

bs<-function(formula,data,indices){
  d<-data[indices,]
  fit<-lm(formula,data=d)
  return(coef(fit))  
}
library(boot)
set.seed(1234)
results<-boot(data=mtcars,statistic=bs,R=1000,formula=mpg~wt+disp)
print(results)
## 
## ORDINARY NONPARAMETRIC BOOTSTRAP
## 
## 
## Call:
## boot(data = mtcars, statistic = bs, R = 1000, formula = mpg ~ 
##     wt + disp)
## 
## 
## Bootstrap Statistics :
##        original        bias    std. error
## t1* 34.96055404  4.715497e-02 2.546106756
## t2* -3.35082533 -4.908125e-02 1.154800744
## t3* -0.01772474  6.230927e-05 0.008518022
boot(data=mtcars,statistic=bs,R=1000,formula=mpg~wt+disp)
## 
## ORDINARY NONPARAMETRIC BOOTSTRAP
## 
## 
## Call:
## boot(data = mtcars, statistic = bs, R = 1000, formula = mpg ~ 
##     wt + disp)
## 
## 
## Bootstrap Statistics :
##        original        bias    std. error
## t1* 34.96055404  0.2734867271 2.523874212
## t2* -3.35082533 -0.1145055892 1.171195882
## t3* -0.01772474  0.0002178158 0.008599433
plot(results,index=2)
image.png
## 計(jì)算車重回歸系數(shù)的置信區(qū)間
boot.ci(results,type="bca",index=2)
## BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
## Based on 1000 bootstrap replicates
## 
## CALL : 
## boot.ci(boot.out = results, type = "bca", index = 2)
## 
## Intervals : 
## Level       BCa          
## 95%   (-5.477, -0.937 )  
## Calculations and Intervals on Original Scale
## 計(jì)算發(fā)動機(jī)排量回歸系數(shù)的置信區(qū)間
boot.ci(results,type="bca",index=3)
## BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
## Based on 1000 bootstrap replicates
## 
## CALL : 
## boot.ci(boot.out = results, type = "bca", index = 3)
## 
## Intervals : 
## Level       BCa          
## 95%   (-0.0334, -0.0011 )  
## Calculations and Intervals on Original Scale

本例計(jì)算的是截距闺阱、車重和發(fā)動機(jī)排量的回歸系數(shù)的置信區(qū)間。

注意事項(xiàng):

①初始樣本大小10~30即可得到足夠好的結(jié)果舵变。

②重復(fù)1000次一般可滿足需求酣溃。

注意,如果樣本代表性不佳纪隙,或者樣本量過小無法反映總體情況赊豌,使用基于隨機(jī)化和重抽樣的統(tǒng)計(jì)方法也無法將其轉(zhuǎn)化為好數(shù)據(jù),因此分析數(shù)據(jù)的準(zhǔn)確是結(jié)論準(zhǔn)確的前提瘫拣。

好了亿絮,今天的R語言實(shí)現(xiàn)統(tǒng)計(jì)方法系列推文暫時(shí)告一段落,我們下次再見吧麸拄! 小伙伴們?nèi)绻惺裁唇y(tǒng)計(jì)上的問題派昧,或者如果想要學(xué)習(xí)什么方面的生物信息內(nèi)容,可以在微信群或者知識星球提問拢切,沒準(zhǔn)哪天的推文就是專門解答你的問題哦蒂萎!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者淮椰。
  • 序言:七十年代末五慈,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子主穗,更是在濱河造成了極大的恐慌泻拦,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件忽媒,死亡現(xiàn)場離奇詭異争拐,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)晦雨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門架曹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人闹瞧,你說我怎么就攤上這事绑雄。” “怎么了奥邮?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵万牺,是天一觀的道長罗珍。 經(jīng)常有香客問我,道長杏愤,這世上最難降的妖魔是什么靡砌? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任已脓,我火速辦了婚禮珊楼,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘度液。我一直安慰自己厕宗,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布堕担。 她就那樣靜靜地躺著已慢,像睡著了一般。 火紅的嫁衣襯著肌膚如雪霹购。 梳的紋絲不亂的頭發(fā)上佑惠,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天,我揣著相機(jī)與錄音齐疙,去河邊找鬼膜楷。 笑死,一個(gè)胖子當(dāng)著我的面吹牛贞奋,可吹牛的內(nèi)容都是我干的赌厅。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼轿塔,長吁一口氣:“原來是場噩夢啊……” “哼特愿!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起勾缭,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤揍障,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后俩由,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體毒嫡,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年采驻,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了审胚。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡礼旅,死狀恐怖膳叨,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情痘系,我是刑警寧澤菲嘴,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響龄坪,放射性物質(zhì)發(fā)生泄漏昭雌。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一健田、第九天 我趴在偏房一處隱蔽的房頂上張望烛卧。 院中可真熱鬧,春花似錦妓局、人聲如沸总放。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽局雄。三九已至,卻和暖如春存炮,著一層夾襖步出監(jiān)牢的瞬間炬搭,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工穆桂, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留宫盔,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓充尉,卻偏偏與公主長得像飘言,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子驼侠,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345