DALS003-統(tǒng)計(jì)推斷(Inference)02-總體與樣本估計(jì)


title: DALS003-統(tǒng)計(jì)推斷(Inference)02-總體與樣本估計(jì)
date: 2019-07-22 12:0:00
type: "tags"
tags:

  • 統(tǒng)計(jì)推斷
    categories:
  • 生物統(tǒng)計(jì)

總體(population)鹤盒、樣本(Sample)和估計(jì)(Estimates)

總體參數(shù)(population parameters)

在小鼠體重的案例中,我們有兩種總體,對(duì)照組雌性小鼠歼郭,高脂組雌性小鼠躏将,其中體重是我們感興趣的指標(biāo)∨繁瘢現(xiàn)在我們假設(shè)種群的數(shù)目是固定的宝与,而其中的隨機(jī)誤差就來(lái)源于抽樣梗醇。我們使用下面的這個(gè)數(shù)據(jù)集來(lái)作為案例鳄抒,這是因?yàn)槲覀冋糜羞@種類型小鼠的數(shù)據(jù)闯捎,現(xiàn)在導(dǎo)入數(shù)據(jù),跟前面的流程一下许溅,如下所示:

library(downloader)
url <- "https://raw.githubusercontent.com/genomicsclass/dagdata/master/inst/extd\
ata/mice_pheno.csv"
filename <- "mice_pheno.csv"
download(url,destfile=filename)
dat <- read.csv(filename)
head(dat)

計(jì)算結(jié)果如下:

> head(dat)
  Sex Diet Bodyweight
1   F   hf      31.94
2   F   hf      32.48
3   F   hf      22.82
4   F   hf      19.92
5   F   hf      32.22
6   F   hf      27.50

現(xiàn)在挑一個(gè)對(duì)照組的種群瓤鼻,如下所示:

library(dplyr)
controlPopulation <- filter(dat,Sex == "F" & Diet == "chow") %>% dplyr::select(Bodyweight) %>% unlist
head(controlPopulation)
length(controlPopulation)

如下所示:

> head(controlPopulation)
Bodyweight1 Bodyweight2 Bodyweight3 Bodyweight4 Bodyweight5 Bodyweight6 
      27.03       24.80       27.02       28.07       23.55       22.72 
> length(controlPopulation)
[1] 225

我們通常使用x_{1},x_{2},\dots,x_{m}來(lái)表示對(duì)照組的這些數(shù)據(jù),其中m表示上述總體中的數(shù)字的數(shù)目贤重。

現(xiàn)在我們來(lái)挑hf組的總體茬祷,如下所示:

hfPopulation <- filter(dat, Sex =="F" & Diet == "hf") %>% dplyr::select(Bodyweight) %>% unlist
head(hfPopulation)
length(hfPopulation)

如下所示:

> head(hfPopulation)
Bodyweight1 Bodyweight2 Bodyweight3 Bodyweight4 Bodyweight5 Bodyweight6 
      31.94       32.48       22.82       19.92       32.22       27.50 
> length(hfPopulation)
[1] 200

現(xiàn)在我們使用y來(lái)表示hf組總體中的數(shù)目,即y_{1}, y_{2}, \dots,y_{y}并蝗,現(xiàn)在我們定義這些總體的一些參數(shù):

均值:
\mu_{X}=\frac{1}{m} \sum_{i=1}^{m} x_{i} \text { and } \mu_{Y}=\frac{1}{n} \sum_{i=1}^{n} y_{i}
方差(variance):
\sigma_{X}^{2}=\frac{1}{m} \sum_{i=1}^{m}\left(x_{i}-\mu_{X}\right)^{2} \text { and } \sigma_{Y}^{2}=\frac{1}{n} \sum_{i=1}^{n}\left(y_{i}-\mu_{Y}\right)^{2}
我們從總體中獲得的這兩個(gè)參數(shù)祭犯,即均值和方差,稱為總體參數(shù)(population parameters)滚停。

我們一開(kāi)始的問(wèn)題就可以這么寫:\mu_{Y}-\mu_{X}=0?

雖然在我們的案例中我們獲取了所有的值沃粗,并且驗(yàn)證這個(gè)問(wèn)題是否為真,但是在實(shí)際中键畴,我們并不能這么干陪每。例如,在實(shí)際實(shí)驗(yàn)中镰吵,購(gòu)買一個(gè)總體中的所有小鼠非常昂貴檩禾。此時(shí),我們可以抽取一個(gè)樣本(sample)來(lái)回答這個(gè)問(wèn)題(也就是hf組和chow組中的小鼠體重的差異是否為0這個(gè)問(wèn)題)疤祭。這就是統(tǒng)計(jì)推斷(statistical inference)的本質(zhì)盼产。

樣本估計(jì)(sample estimates)

在前面部分中,我們從每個(gè)總體(hf總體和chow總體)中獲取了樣本勺馆,每個(gè)樣本中有12只小鼠戏售。在統(tǒng)計(jì)學(xué)中,我們經(jīng)常使用大寫字母來(lái)表示這些隨機(jī)抽取的樣本草穆。因此這些樣本就是X_{1}, \ldots, X_{M}Y_{1}, \ldots, Y_{N}灌灾,在這個(gè)案例中,假設(shè)我們有12個(gè)樣本悲柱,也就是說(shuō)N=M=12锋喜,當(dāng)我們列出總體的值時(shí)(這個(gè)總體此時(shí)是設(shè)定的,不隨機(jī)的),我們就使用小寫字母來(lái)下標(biāo)它們嘿般。

由于我們想知道總體的兩個(gè)均值\mu_{Y}-\mu_{X}是否為0段标,我們可以通過(guò)計(jì)算它們的樣本之差是否為0,也即\bar{Y}-\bar{X}是否為0來(lái)進(jìn)行推斷(在統(tǒng)計(jì)學(xué)中炉奴,常用希臘字母\mu來(lái)表示總體均值逼庞,而用大寫字母上加橫的形式表示樣本均值):
\overline{X}=\frac{1}{M} \sum_{i=1}^{M} X_{i} \text { and } \overline{Y}=\frac{1}{N} \sum_{i=1}^{N} Y_{i}
需要注意的是,2個(gè)均值的差值也是一個(gè)隨機(jī)變量瞻赶,這些內(nèi)容我們?cè)谇懊嬉呀?jīng)提及赛糟。

練習(xí)

P39

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市砸逊,隨后出現(xiàn)的幾起案子璧南,更是在濱河造成了極大的恐慌,老刑警劉巖痹兜,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件穆咐,死亡現(xiàn)場(chǎng)離奇詭異颤诀,居然都是意外死亡字旭,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門崖叫,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)遗淳,“玉大人,你說(shuō)我怎么就攤上這事心傀∏担” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵脂男,是天一觀的道長(zhǎng)养叛。 經(jīng)常有香客問(wèn)我,道長(zhǎng)宰翅,這世上最難降的妖魔是什么弃甥? 我笑而不...
    開(kāi)封第一講書人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮汁讼,結(jié)果婚禮上淆攻,老公的妹妹穿的比我還像新娘。我一直安慰自己嘿架,他們只是感情好瓶珊,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著耸彪,像睡著了一般伞芹。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上蝉娜,一...
    開(kāi)封第一講書人閱讀 49,111評(píng)論 1 285
  • 那天丑瞧,我揣著相機(jī)與錄音柑土,去河邊找鬼。 笑死绊汹,一個(gè)胖子當(dāng)著我的面吹牛稽屏,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播西乖,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼狐榔,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了获雕?” 一聲冷哼從身側(cè)響起薄腻,我...
    開(kāi)封第一講書人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎届案,沒(méi)想到半個(gè)月后庵楷,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡楣颠,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年尽纽,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片童漩。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡弄贿,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出矫膨,到底是詐尸還是另有隱情差凹,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布侧馅,位于F島的核電站危尿,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏馁痴。R本人自食惡果不足惜谊娇,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望弥搞。 院中可真熱鬧邮绿,春花似錦、人聲如沸攀例。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)粤铭。三九已至挖胃,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背酱鸭。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工吗垮, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人凹髓。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓烁登,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親蔚舀。 傳聞我的和親對(duì)象是個(gè)殘疾皇子饵沧,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容