第二部分 第7章基本統(tǒng)計分析

7.1 描述性統(tǒng)計分析

連續(xù)型變量的中心趨勢、變化性和分布形狀的方法。

7.1.1 方法云集

基礎(chǔ)安裝中的函數(shù):summary()函數(shù)來獲取描述性統(tǒng)計量(最小值俐银、最大值、四分位數(shù)和數(shù)值型變量的均值逛万,以及因子向量和邏輯型向量的頻數(shù)統(tǒng)計)
apply()函數(shù)
sapply()函數(shù) :sapply(x, FUN, options)
fivenum()函數(shù):返回最小值、下四分位數(shù)批钠、中位數(shù)宇植、上四分位數(shù)和最大值。

7.1.2 更多方法

  • Hmisc包中的describe()函數(shù)
  • pastecs包中的stat.desc()函數(shù)
  • psych包中describe()函數(shù)

最后載入的程序包優(yōu)先埋心。

7.1.3 分組計算描述性統(tǒng)計量

  • aggregate()函數(shù)分組獲取描述性統(tǒng)計量
  • by()分組計算描述性統(tǒng)計量

7.1.4 分組計算的擴(kuò)展

  • doBy包中的summaryBy()分組計算概述統(tǒng)計量
  • psych包中的describeBy()分組計算概述統(tǒng)計量

7.1.5 結(jié)果的可視化

7.2 頻數(shù)表和列聯(lián)表

類別型變量的頻數(shù)表和列聯(lián)表指郁,以及相應(yīng)的獨立性檢驗、相關(guān)性的度量拷呆、圖形化展示結(jié)果的方法闲坎。

7.2.1 生成頻數(shù)表

用于創(chuàng)建和處理列聯(lián)表的函數(shù)

函數(shù) 描述
table(var1, var2, ..., varN) 使用N個類別型變量創(chuàng)建一個N維列聯(lián)表
xtabs(formula, data) 根據(jù)一個公式和一個矩陣或數(shù)據(jù)框創(chuàng)建一個N維列聯(lián)表
prop.table(table, margins) 依m(xù)argins定義的邊際列表將表中條目表示為分?jǐn)?shù)形式
margin.table(table, margins) 依m(xù)argins定義的邊際列表計算表中條目的和
addmargins(table, margins) 將概述邊margins放入表中
ftable(table) 創(chuàng)建一個緊湊的平鋪式列聯(lián)表
  • 一維列聯(lián)表
> mytable <- with(Arthritis,table(Improved))
> mytable
Improved
  None   Some Marked 
    42     14     28 
> prop.table(mytable)
Improved
     None      Some    Marked 
0.5000000 0.1666667 0.3333333 
> prop.table(mytable)*100
Improved
    None     Some   Marked 
50.00000 16.66667 33.33333 
  • 二維列聯(lián)表,table()函數(shù)使用格式為:mytable<-xtabs(~A+B, data=mydata)
> mytable <- xtabs(~ Treatment+Improved, data=Arthritis)
> mytable
         Improved
Treatment None Some Marked
  Placebo   29    7      7
  Treated   13    7     21

使用Crosstable生成二維列聯(lián)表

library(gmodels)
CrossTable(Arthritis$Treatment,Arthritis$Improved)
Total Observations in Table:  84 

 
                    | Arthritis$Improved 
Arthritis$Treatment |      None |      Some |    Marked | Row Total | 
--------------------|-----------|-----------|-----------|-----------|
            Placebo |        29 |         7 |         7 |        43 | 
                    |     2.616 |     0.004 |     3.752 |           | 
                    |     0.674 |     0.163 |     0.163 |     0.512 | 
                    |     0.690 |     0.500 |     0.250 |           | 
                    |     0.345 |     0.083 |     0.083 |           | 
--------------------|-----------|-----------|-----------|-----------|
            Treated |        13 |         7 |        21 |        41 | 
                    |     2.744 |     0.004 |     3.935 |           | 
                    |     0.317 |     0.171 |     0.512 |     0.488 | 
                    |     0.310 |     0.500 |     0.750 |           | 
                    |     0.155 |     0.083 |     0.250 |           | 
--------------------|-----------|-----------|-----------|-----------|
       Column Total |        42 |        14 |        28 |        84 | 
                    |     0.500 |     0.167 |     0.333 |           | 
--------------------|-----------|-----------|-----------|-----------|
  • 多維列聯(lián)表
    table(), xtabs(), ftable()

7.2.2 獨立性檢驗

主要介紹三種檢驗:卡方獨立性檢驗茬斧、Fisher精確檢驗腰懂、Cochran-Mantel-Haenszel檢驗

  • 卡方獨立性檢驗:chisq.test()函數(shù)
  • Fisher精確檢驗:fisher.test()函數(shù)
  • Cochran-Mantel-Haenszel檢驗:mantlehaen.test()函數(shù)

7.2.3 相關(guān)性的度量

vcd包中的assocstats()函數(shù)

7.2.4 結(jié)果的可視化

7.3 相關(guān)

相關(guān)系數(shù)可以用來描述定量變量之間的關(guān)系。
±表明關(guān)系的方向项秉,值的大小表明關(guān)系的強(qiáng)弱程度绣溜。

7.3.1 相關(guān)的類型

  • Pearson(兩個定量變量之間的線性相關(guān)程度)、Spearman(衡量分級定序變量之間的相關(guān)程度)和 Kendall相關(guān)(非參數(shù)的等級相關(guān)度量)
    cor()函數(shù)可以計算這三種相關(guān)系數(shù)伙狐;cov()函數(shù)可計算協(xié)方差
    cor(x, use=, method= )
參數(shù) 描述
x 矩陣或數(shù)據(jù)框
use 指定缺失數(shù)據(jù)的處理方式
method 指定相關(guān)系數(shù)的類型
  • 偏相關(guān):在控制一個或多個定量變量時涮毫,另外兩個定量變量之間的相互關(guān)系瞬欧。
    ggm包中的pcor()函數(shù)計算偏相關(guān)系數(shù)贷屎,pcor(u, s)
  • 其他類型的相關(guān)
    polycor包中的hetcor()函數(shù):可以計算一種混合的相關(guān)矩陣。

7.3.2 相關(guān)性的顯著性檢驗

cor.test(x, y, alternative = , method = )

7.3.3 相關(guān)關(guān)系的可視化

correlogram相關(guān)圖

7.4 t檢驗

兩個組進(jìn)行比較

7.4.1 獨立樣本的t檢驗

t.test (y ~ x, data)

7.4.2 非獨立樣本的t檢驗

t.test(y1,y2, paired=TRUE)

7.4.3 多于兩組的情況

方差分析(ANOVA)

7.5 組間差異的非參數(shù)檢驗

7.5.1 兩組的比較

兩組數(shù)據(jù)獨立艘虎,使用Wilcoxon秩和檢驗(Mann-Whitney U檢驗)
wilcox.test(y ~ x, data)

7.5.2 多于兩組的比較

kruskal.test(y ~ A, data)
friedman.test(y ~ A | B, data)

7.6 組間差異的可視化

7.7 小結(jié)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末唉侄,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子野建,更是在濱河造成了極大的恐慌属划,老刑警劉巖恬叹,帶你破解...
    沈念sama閱讀 217,084評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異同眯,居然都是意外死亡绽昼,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,623評論 3 392
  • 文/潘曉璐 我一進(jìn)店門须蜗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來硅确,“玉大人,你說我怎么就攤上這事明肮×馀” “怎么了?”我有些...
    開封第一講書人閱讀 163,450評論 0 353
  • 文/不壞的土叔 我叫張陵柿估,是天一觀的道長循未。 經(jīng)常有香客問我,道長秫舌,這世上最難降的妖魔是什么的妖? 我笑而不...
    開封第一講書人閱讀 58,322評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮舅巷,結(jié)果婚禮上羔味,老公的妹妹穿的比我還像新娘。我一直安慰自己钠右,他們只是感情好赋元,可當(dāng)我...
    茶點故事閱讀 67,370評論 6 390
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著飒房,像睡著了一般搁凸。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上狠毯,一...
    開封第一講書人閱讀 51,274評論 1 300
  • 那天护糖,我揣著相機(jī)與錄音,去河邊找鬼嚼松。 笑死嫡良,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的献酗。 我是一名探鬼主播寝受,決...
    沈念sama閱讀 40,126評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼罕偎!你這毒婦竟也來了很澄?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,980評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎甩苛,沒想到半個月后蹂楣,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,414評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡讯蒲,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,599評論 3 334
  • 正文 我和宋清朗相戀三年痊土,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片墨林。...
    茶點故事閱讀 39,773評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡施戴,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出萌丈,到底是詐尸還是另有隱情赞哗,我是刑警寧澤,帶...
    沈念sama閱讀 35,470評論 5 344
  • 正文 年R本政府宣布辆雾,位于F島的核電站肪笋,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏度迂。R本人自食惡果不足惜藤乙,卻給世界環(huán)境...
    茶點故事閱讀 41,080評論 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望惭墓。 院中可真熱鬧坛梁,春花似錦、人聲如沸腊凶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,713評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽钧萍。三九已至褐缠,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間风瘦,已是汗流浹背队魏。 一陣腳步聲響...
    開封第一講書人閱讀 32,852評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留万搔,地道東北人胡桨。 一個月前我還...
    沈念sama閱讀 47,865評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像瞬雹,于是被迫代替她去往敵國和親昧谊。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,689評論 2 354