《R語言實(shí)戰(zhàn)》自學(xué)筆記40-描述性統(tǒng)計(jì)分析

數(shù)據(jù)準(zhǔn)備

df <- read.table(file = "D:/Documents/R wd/df.csv", header = T, sep = ",", colClasses = c(year = "character", nitrogen = "character", variety = "character", block = "character")) # 數(shù)據(jù)導(dǎo)入禁舷。
df # 查看數(shù)據(jù)彪杉。
##    year nitrogen variety block   v1   v2  v3   v4
## 1  2020       N1       a     1 1.26 2.14 3.4 4.66
## 2  2020       N1       a     2 1.20 2.90 4.1 5.30
## 3  2020       N1       a     3 1.30 3.00 4.3 5.60
## 4  2020       N1       b     1 1.08 1.72 2.8 3.88
## 5  2020       N1       b     2 1.05 1.65 2.7 3.75
## 6  2020       N1       b     3 1.15 1.35 2.5 3.65
## 7  2020       N2       a     1 1.32 3.78 5.1 6.42
## 8  2020       N2       a     2 1.28 4.32 5.6 6.88
## 9  2020       N2       a     3 1.35 3.95 5.3 6.65
## 10 2020       N2       b     1 1.33 3.47 4.8 6.13
## 11 2020       N2       b     2 1.28 2.72 4.0 5.28
## 12 2020       N2       b     3 1.30 3.90 5.2 6.50
## 13 2021       N1       a     1 1.19 3.61 4.8 5.99
## 14 2021       N1       a     2 1.21 3.29 4.5 5.71
## 15 2021       N1       a     3 1.24 3.26 4.5 5.74
## 16 2021       N1       b     1 1.09 2.71 3.8 4.89
## 17 2021       N1       b     2 1.28 2.32 3.6 4.88
## 18 2021       N1       b     3 1.35 1.95 3.3 4.65
## 19 2021       N2       a     1 1.45 4.35 5.8 7.25
## 20 2021       N2       a     2 1.40 3.80 5.2 6.60
## 21 2021       N2       a     3 1.37 4.23 5.6 6.97
## 22 2021       N2       b     1 1.28 2.72 4.0 5.28
## 23 2021       N2       b     2 1.15 3.35 4.5 5.65
## 24 2021       N2       b     3 1.24 3.46 4.7 5.94

第7章 基本統(tǒng)計(jì)分析

7.1 描述性統(tǒng)計(jì)分析

7.1.1 方法云集

對(duì)于基礎(chǔ)安裝毅往,你可以使用summary()函數(shù)來獲取描述性統(tǒng)計(jì)量。
summary()函數(shù)提供了最小值派近、最大值攀唯、四分位數(shù)和數(shù)值型變量的均值,以及因子向量和邏輯型向量的頻數(shù)統(tǒng)計(jì)渴丸。

summary(df[,5:8]) # summary函數(shù)計(jì)算df數(shù)據(jù)集5到8列的描述性統(tǒng)計(jì)量侯嘀。
##        v1              v2              v3              v4       
##  Min.   :1.050   Min.   :1.350   Min.   :2.500   Min.   :3.650  
##  1st Qu.:1.198   1st Qu.:2.612   1st Qu.:3.750   1st Qu.:4.888  
##  Median :1.280   Median :3.275   Median :4.500   Median :5.680  
##  Mean   :1.256   Mean   :3.081   Mean   :4.338   Mean   :5.594  
##  3rd Qu.:1.323   3rd Qu.:3.785   3rd Qu.:5.125   3rd Qu.:6.440  
##  Max.   :1.450   Max.   :4.350   Max.   :5.800   Max.   :7.250

sapply(x, FUN, options)
x:數(shù)據(jù)框(或矩陣);
FUN為一個(gè)任意的函數(shù)谱轨。如果指定了options戒幔,它們將被傳遞給FUN。

## 通過sapply函數(shù)計(jì)算描述性統(tǒng)計(jì)土童。 
mystats <- function(x, na.omit=FALSE){
  if(na.omit)
    x <- x[!is.na(x)]
   n <- length(x)
   m <- mean(x)
   s <- sd(x)
   skew <- sum((x-m)^3/s^3)/n
   kurt <- sum((x-m)^4/s^4)/n-3
   return(c(n=n, mean=m, stdev=s, skew=skew, kurtosis=kurt))
} # 定義描述性統(tǒng)計(jì)的函數(shù)诗茎,n為樣本量,m為平均值献汗,s為標(biāo)準(zhǔn)差敢订,skew為偏度,kurt為峰度罢吃。
sapply(df[5:8], mystats) # sapply函數(shù)描述性統(tǒng)計(jì)楚午。
##                  v1         v2         v3         v4
## n        24.0000000 24.0000000 24.0000000 24.0000000
## mean      1.2562500  3.0812500  4.3375000  5.5937500
## stdev     0.1018017  0.8771957  0.9430812  1.0149183
## skew     -0.2991286 -0.3609173 -0.3371765 -0.3209242
## kurtosis -0.6567661 -1.0459573 -0.9674555 -0.8823974

擴(kuò)展學(xué)習(xí)-偏度和峰度
1 偏度
偏度(Skewness)可以用來度量隨機(jī)變量概率分布的不對(duì)稱性。公式如下:
S = \frac {1}n \sum_{i=1}^{n} [(\frac {X_i-\mu}{\sigma})^3 ]
其中\mu是均值尿招,\sigma是標(biāo)準(zhǔn)差矾柜。
偏度的取值范圍為(-∞,+∞)
當(dāng)偏度<0時(shí),概率分布圖左偏就谜。
當(dāng)偏度=0時(shí)把沼,表示數(shù)據(jù)相對(duì)均勻的分布在平均值兩側(cè),不一定是絕對(duì)的對(duì)稱分布吁伺。
當(dāng)偏度>0時(shí)饮睬,概率分布圖右偏。

2 峰度
峰度(Kurtosis)可以用來度量隨機(jī)變量概率分布的陡峭程度篮奄。公式:

K= \frac {1}n \sum_{i=1}^{n} [(\frac {X_i-\mu}{\sigma})^4 ]

其中\mu是均值捆愁,\sigma是標(biāo)準(zhǔn)差割去。
峰度的取值范圍為[1,+∞),完全服從正態(tài)分布的數(shù)據(jù)的峰度值為3昼丑,峰度值越大呻逆,概率分布圖越高尖,峰度值越小菩帝,越矮胖咖城。
通常我們將峰度值減去3,也被稱為超值峰度(Excess Kurtosis)呼奢,這樣正態(tài)分布的峰度值等于0宜雀,當(dāng)峰度值>0,則表示該數(shù)據(jù)分布與正態(tài)分布相比較為高尖握础,當(dāng)峰度值<0辐董,則表示該數(shù)據(jù)分布與正態(tài)分布相比較為矮胖。

擴(kuò)展

Hmisc包中的describe()函數(shù)可返回變量和觀測(cè)的數(shù)量禀综、缺失值和唯一值的數(shù)目简烘、平均值、分位數(shù)定枷,以及五個(gè)最大的值和五個(gè)最小的值孤澎。

library(Hmisc) # 調(diào)用Hmisc包,調(diào)用前請(qǐng)安裝欠窒。
describe(df$v1) # 顯示結(jié)果覆旭。
## df$v1 
##        n  missing distinct     Info     Mean      Gmd      .05      .10 
##       24        0       17    0.994    1.256   0.1169    1.082    1.108 
##      .25      .50      .75      .90      .95 
##    1.197    1.280    1.323    1.364    1.395 
## 
## lowest : 1.05 1.08 1.09 1.15 1.19, highest: 1.33 1.35 1.37 1.40 1.45
##                                                                             
## Value       1.05  1.08  1.09  1.15  1.19  1.20  1.21  1.24  1.26  1.28  1.30
## Frequency      1     1     1     2     1     1     1     2     1     4     2
## Proportion 0.042 0.042 0.042 0.083 0.042 0.042 0.042 0.083 0.042 0.167 0.083
##                                               
## Value       1.32  1.33  1.35  1.37  1.40  1.45
## Frequency      1     1     2     1     1     1
## Proportion 0.042 0.042 0.083 0.042 0.042 0.042

pastecs包中有一個(gè)名為stat.desc()的函數(shù),它可以計(jì)算種類繁多的描述性統(tǒng)計(jì)量贱迟。 stat.desc(x, basic=TRUE, desc=TRUE, norm=FALSE, p=0.95)
x是一個(gè)數(shù)據(jù)框或時(shí)間序列姐扮。若basic=TRUE(默認(rèn)值),則計(jì)算其中所有值衣吠、空值茶敏、缺失值的數(shù)量,以及最小值缚俏、最大值惊搏、值域,還有總和忧换。若desc=TRUE(同樣也是默認(rèn)值)恬惯,則計(jì)算中位數(shù)、平均數(shù)亚茬、平均數(shù)的標(biāo)準(zhǔn)誤酪耳、平均數(shù)置信度為95%的置信區(qū)間、方差、標(biāo)準(zhǔn)差以及變異系數(shù)碗暗。最后颈将,若norm=TRUE(不是默認(rèn)的),則返回正態(tài)分布統(tǒng)計(jì)量言疗,包括偏度和峰度(以及它們的統(tǒng)計(jì)顯著程度)和Shapiro--Wilk正態(tài)檢驗(yàn)結(jié)果晴圾。這里使用了p值來計(jì)算平均數(shù)的置信區(qū)間(默認(rèn)置信度為0.95)。

library(pastecs) # 調(diào)用pastecs包噪奄。
stat.desc(df$v1, norm=TRUE, p=0.95) # 返回結(jié)果死姚。
##      nbr.val     nbr.null       nbr.na          min          max        range 
##  24.00000000   0.00000000   0.00000000   1.05000000   1.45000000   0.40000000 
##          sum       median         mean      SE.mean CI.mean.0.95          var 
##  30.15000000   1.28000000   1.25625000   0.02078019   0.04298709   0.01036359 
##      std.dev     coef.var     skewness     skew.2SE     kurtosis     kurt.2SE 
##   0.10180170   0.08103618  -0.29912856  -0.31669845  -0.65676606  -0.35780260 
##   normtest.W   normtest.p 
##   0.97472260   0.78255589

psych包也擁有一個(gè)名為describe()的函數(shù),它可以計(jì)算非缺失值的數(shù)量勤篮、平均數(shù)都毒、標(biāo)準(zhǔn)差、中位數(shù)叙谨、截尾均值温鸽、絕對(duì)中位差保屯、最小值手负、最大值、值域姑尺、偏度竟终、峰度和平均值的標(biāo)準(zhǔn)誤。

library(psych) # 調(diào)用psych包切蟋。
describe(df$v1) # 返回結(jié)果统捶。
##    vars  n mean  sd median trimmed mad  min  max range skew kurtosis   se
## X1    1 24 1.26 0.1   1.28    1.26 0.1 1.05 1.45   0.4 -0.3    -0.66 0.02

7.1.2 分組計(jì)算描述性統(tǒng)計(jì)量

aggregate(x, by=list, FUN) 如果有多個(gè)分組變量,使用by=list(name1=groupvar1, name2=groupvar2, ... ,groupvarN)這樣的語句柄粹。

aggregate(df$v1, by=list(df$year, df$nitrogen, df$variety), FUN=mean) # 分組統(tǒng)計(jì)喘鸟。
##   Group.1 Group.2 Group.3        x
## 1    2020      N1       a 1.253333
## 2    2021      N1       a 1.213333
## 3    2020      N2       a 1.316667
## 4    2021      N2       a 1.406667
## 5    2020      N1       b 1.093333
## 6    2021      N1       b 1.240000
## 7    2020      N2       b 1.303333
## 8    2021      N2       b 1.223333

by(data, INDICES, FUN)
data:一個(gè)數(shù)據(jù)框或矩陣;
INDICES:一個(gè)因子或因子組成的列表驻右,定義了分組什黑;
FUN是任意函數(shù)。

myfun <- function(x) {
  c(mean = mean(x), sd = sd(x))
} # 定義函數(shù)myfun堪夭。
by(df$v1, df$year, myfun) # 對(duì)df數(shù)據(jù)的v1以year進(jìn)行平均值和標(biāo)準(zhǔn)差的統(tǒng)計(jì)愕把。
## df$year: 2020
##       mean         sd 
## 1.24166667 0.09943781 
## ------------------------------------------------------------ 
## df$year: 2021
##      mean        sd 
## 1.2708333 0.1063834
by(df[,5:8], df[,1:3], summary) # 對(duì)df數(shù)據(jù)的5到8列進(jìn)行描述性統(tǒng)計(jì),以前3列分分組依據(jù)森爽。
## year: 2020
## nitrogen: N1
## variety: a
##        v1              v2             v3              v4       
##  Min.   :1.200   Min.   :2.14   Min.   :3.400   Min.   :4.660  
##  1st Qu.:1.230   1st Qu.:2.52   1st Qu.:3.750   1st Qu.:4.980  
##  Median :1.260   Median :2.90   Median :4.100   Median :5.300  
##  Mean   :1.253   Mean   :2.68   Mean   :3.933   Mean   :5.187  
##  3rd Qu.:1.280   3rd Qu.:2.95   3rd Qu.:4.200   3rd Qu.:5.450  
##  Max.   :1.300   Max.   :3.00   Max.   :4.300   Max.   :5.600  
## ------------------------------------------------------------ 
## year: 2021
## nitrogen: N1
## variety: a
##        v1              v2              v3             v4       
##  Min.   :1.190   Min.   :3.260   Min.   :4.50   Min.   :5.710  
##  1st Qu.:1.200   1st Qu.:3.275   1st Qu.:4.50   1st Qu.:5.725  
##  Median :1.210   Median :3.290   Median :4.50   Median :5.740  
##  Mean   :1.213   Mean   :3.387   Mean   :4.60   Mean   :5.813  
##  3rd Qu.:1.225   3rd Qu.:3.450   3rd Qu.:4.65   3rd Qu.:5.865  
##  Max.   :1.240   Max.   :3.610   Max.   :4.80   Max.   :5.990  
## ------------------------------------------------------------ 
## year: 2020
## nitrogen: N2
## variety: a
##        v1              v2              v3              v4       
##  Min.   :1.280   Min.   :3.780   Min.   :5.100   Min.   :6.420  
##  1st Qu.:1.300   1st Qu.:3.865   1st Qu.:5.200   1st Qu.:6.535  
##  Median :1.320   Median :3.950   Median :5.300   Median :6.650  
##  Mean   :1.317   Mean   :4.017   Mean   :5.333   Mean   :6.650  
##  3rd Qu.:1.335   3rd Qu.:4.135   3rd Qu.:5.450   3rd Qu.:6.765  
##  Max.   :1.350   Max.   :4.320   Max.   :5.600   Max.   :6.880  
## ------------------------------------------------------------ 
## year: 2021
## nitrogen: N2
## variety: a
##        v1              v2              v3              v4       
##  Min.   :1.370   Min.   :3.800   Min.   :5.200   Min.   :6.600  
##  1st Qu.:1.385   1st Qu.:4.015   1st Qu.:5.400   1st Qu.:6.785  
##  Median :1.400   Median :4.230   Median :5.600   Median :6.970  
##  Mean   :1.407   Mean   :4.127   Mean   :5.533   Mean   :6.940  
##  3rd Qu.:1.425   3rd Qu.:4.290   3rd Qu.:5.700   3rd Qu.:7.110  
##  Max.   :1.450   Max.   :4.350   Max.   :5.800   Max.   :7.250  
## ------------------------------------------------------------ 
## year: 2020
## nitrogen: N1
## variety: b
##        v1              v2              v3              v4       
##  Min.   :1.050   Min.   :1.350   Min.   :2.500   Min.   :3.650  
##  1st Qu.:1.065   1st Qu.:1.500   1st Qu.:2.600   1st Qu.:3.700  
##  Median :1.080   Median :1.650   Median :2.700   Median :3.750  
##  Mean   :1.093   Mean   :1.573   Mean   :2.667   Mean   :3.760  
##  3rd Qu.:1.115   3rd Qu.:1.685   3rd Qu.:2.750   3rd Qu.:3.815  
##  Max.   :1.150   Max.   :1.720   Max.   :2.800   Max.   :3.880  
## ------------------------------------------------------------ 
## year: 2021
## nitrogen: N1
## variety: b
##        v1              v2              v3              v4       
##  Min.   :1.090   Min.   :1.950   Min.   :3.300   Min.   :4.650  
##  1st Qu.:1.185   1st Qu.:2.135   1st Qu.:3.450   1st Qu.:4.765  
##  Median :1.280   Median :2.320   Median :3.600   Median :4.880  
##  Mean   :1.240   Mean   :2.327   Mean   :3.567   Mean   :4.807  
##  3rd Qu.:1.315   3rd Qu.:2.515   3rd Qu.:3.700   3rd Qu.:4.885  
##  Max.   :1.350   Max.   :2.710   Max.   :3.800   Max.   :4.890  
## ------------------------------------------------------------ 
## year: 2020
## nitrogen: N2
## variety: b
##        v1              v2              v3              v4       
##  Min.   :1.280   Min.   :2.720   Min.   :4.000   Min.   :5.280  
##  1st Qu.:1.290   1st Qu.:3.095   1st Qu.:4.400   1st Qu.:5.705  
##  Median :1.300   Median :3.470   Median :4.800   Median :6.130  
##  Mean   :1.303   Mean   :3.363   Mean   :4.667   Mean   :5.970  
##  3rd Qu.:1.315   3rd Qu.:3.685   3rd Qu.:5.000   3rd Qu.:6.315  
##  Max.   :1.330   Max.   :3.900   Max.   :5.200   Max.   :6.500  
## ------------------------------------------------------------ 
## year: 2021
## nitrogen: N2
## variety: b
##        v1              v2              v3             v4       
##  Min.   :1.150   Min.   :2.720   Min.   :4.00   Min.   :5.280  
##  1st Qu.:1.195   1st Qu.:3.035   1st Qu.:4.25   1st Qu.:5.465  
##  Median :1.240   Median :3.350   Median :4.50   Median :5.650  
##  Mean   :1.223   Mean   :3.177   Mean   :4.40   Mean   :5.623  
##  3rd Qu.:1.260   3rd Qu.:3.405   3rd Qu.:4.60   3rd Qu.:5.795  
##  Max.   :1.280   Max.   :3.460   Max.   :4.70   Max.   :5.940

擴(kuò)展

doBy包中summaryBy()函數(shù)分組計(jì)算描述性統(tǒng)計(jì)量恨豁。
summaryBy(formula, data=dataframe, FUN=function)
formula可接受的格式var1 + var2 + var3 +....+ varN ~ groupvar1 + groupvar2 + groupvar3 +....+ groupvarN.
在~左側(cè)的變量是需要分析的數(shù)值型變量,而右側(cè)的變量是類別型的分組變量爬迟。function可為任何內(nèi)建或用戶自編的R函數(shù)橘蜜。

myfun <- function(x) {
  c(mean = mean(x), sd = sd(x))
} # 定義函數(shù)myfun。
library(doBy) # 調(diào)用doBy包付呕。
summaryBy(v1 + v2 ~ year + nitrogen + variety, data = df, FUN = myfun) # 返回結(jié)果计福。
##   year nitrogen variety  v1.mean      v1.sd  v2.mean     v2.sd
## 1 2020       N1       a 1.253333 0.05033223 2.680000 0.4703190
## 2 2020       N1       b 1.093333 0.05131601 1.573333 0.1965536
## 3 2020       N2       a 1.316667 0.03511885 4.016667 0.2761038
## 4 2020       N2       b 1.303333 0.02516611 3.363333 0.5971879
## 5 2021       N1       a 1.213333 0.02516611 3.386667 0.1939931
## 6 2021       N1       b 1.240000 0.13453624 2.326667 0.3800439
## 7 2021       N2       a 1.406667 0.04041452 4.126667 0.2891943
## 8 2021       N2       b 1.223333 0.06658328 3.176667 0.3992910

psych包中的describe.by()函數(shù)分組計(jì)算概述統(tǒng)計(jì)量捧请。 一個(gè)以上的分組變量時(shí)可以list(groupvar1, groupvar2, ... , groupvarN)

library(psych) # 調(diào)用psych包。
describe.by(df, df$year) # 返回結(jié)果棒搜,計(jì)算df數(shù)據(jù)集5到8列的描述性統(tǒng)計(jì)量疹蛉,分組變量是year。
## 
##  Descriptive statistics by group 
## group: 2020
##           vars  n mean   sd median trimmed  mad  min  max range  skew kurtosis
## year*        1 12 1.00 0.00   1.00    1.00 0.00 1.00 1.00  0.00   NaN      NaN
## nitrogen*    2 12 1.50 0.52   1.50    1.50 0.74 1.00 2.00  1.00  0.00    -2.16
## variety*     3 12 1.50 0.52   1.50    1.50 0.74 1.00 2.00  1.00  0.00    -2.16
## block*       4 12 2.00 0.85   2.00    2.00 1.48 1.00 3.00  2.00  0.00    -1.74
## v1           5 12 1.24 0.10   1.28    1.25 0.07 1.05 1.35  0.30 -0.78    -0.98
## v2           6 12 2.91 1.01   2.95    2.92 1.32 1.35 4.32  2.97 -0.18    -1.59
## v3           7 12 4.15 1.09   4.20    4.17 1.41 2.50 5.60  3.10 -0.23    -1.60
## v4           8 12 5.39 1.18   5.45    5.42 1.50 3.65 6.88  3.23 -0.28    -1.60
##             se
## year*     0.00
## nitrogen* 0.15
## variety*  0.15
## block*    0.25
## v1        0.03
## v2        0.29
## v3        0.32
## v4        0.34
## ------------------------------------------------------------ 
## group: 2021
##           vars  n mean   sd median trimmed  mad  min  max range  skew kurtosis
## year*        1 12 1.00 0.00   1.00    1.00 0.00 1.00 1.00  0.00   NaN      NaN
## nitrogen*    2 12 1.50 0.52   1.50    1.50 0.74 1.00 2.00  1.00  0.00    -2.16
## variety*     3 12 1.50 0.52   1.50    1.50 0.74 1.00 2.00  1.00  0.00    -2.16
## block*       4 12 2.00 0.85   2.00    2.00 1.48 1.00 3.00  2.00  0.00    -1.74
## v1           5 12 1.27 0.11   1.26    1.27 0.12 1.09 1.45  0.36  0.06    -1.19
## v2           6 12 3.25 0.73   3.32    3.28 0.80 1.95 4.35  2.40 -0.19    -1.11
## v3           7 12 4.53 0.77   4.50    4.52 0.89 3.30 5.80  2.50  0.09    -1.20
## v4           8 12 5.80 0.82   5.72    5.76 0.95 4.65 7.25  2.60  0.31    -1.20
##             se
## year*     0.00
## nitrogen* 0.15
## variety*  0.15
## block*    0.25
## v1        0.03
## v2        0.21
## v3        0.22
## v4        0.24
describe.by(df$v1, list(df$year, df$nitrogen, df$variety)) # 返回結(jié)果力麸,計(jì)算df數(shù)據(jù)v1的描述性統(tǒng)計(jì)量可款,分組變量是year,nitrogen,variety。
## 
##  Descriptive statistics by group 
## : 2020
## : N1
## : a
##    vars n mean   sd median trimmed  mad min max range  skew kurtosis   se
## X1    1 3 1.25 0.05   1.26    1.25 0.06 1.2 1.3   0.1 -0.13    -2.33 0.03
## ------------------------------------------------------------ 
## : 2021
## : N1
## : a
##    vars n mean   sd median trimmed  mad  min  max range skew kurtosis   se
## X1    1 3 1.21 0.03   1.21    1.21 0.03 1.19 1.24  0.05 0.13    -2.33 0.01
## ------------------------------------------------------------ 
## : 2020
## : N2
## : a
##    vars n mean   sd median trimmed  mad  min  max range  skew kurtosis   se
## X1    1 3 1.32 0.04   1.32    1.32 0.04 1.28 1.35  0.07 -0.09    -2.33 0.02
## ------------------------------------------------------------ 
## : 2021
## : N2
## : a
##    vars n mean   sd median trimmed  mad  min  max range skew kurtosis   se
## X1    1 3 1.41 0.04    1.4    1.41 0.04 1.37 1.45  0.08 0.16    -2.33 0.02
## ------------------------------------------------------------ 
## : 2020
## : N1
## : b
##    vars n mean   sd median trimmed  mad  min  max range skew kurtosis   se
## X1    1 3 1.09 0.05   1.08    1.09 0.04 1.05 1.15   0.1 0.24    -2.33 0.03
## ------------------------------------------------------------ 
## : 2021
## : N1
## : b
##    vars n mean   sd median trimmed mad  min  max range  skew kurtosis   se
## X1    1 3 1.24 0.13   1.28    1.24 0.1 1.09 1.35  0.26 -0.27    -2.33 0.08
## ------------------------------------------------------------ 
## : 2020
## : N2
## : b
##    vars n mean   sd median trimmed  mad  min  max range skew kurtosis   se
## X1    1 3  1.3 0.03    1.3     1.3 0.03 1.28 1.33  0.05 0.13    -2.33 0.01
## ------------------------------------------------------------ 
## : 2021
## : N2
## : b
##    vars n mean   sd median trimmed  mad  min  max range  skew kurtosis   se
## X1    1 3 1.22 0.07   1.24    1.22 0.06 1.15 1.28  0.13 -0.23    -2.33 0.04

7.1.3 結(jié)果的可視化

df1 <- aggregate(df$v1, by = list(df$year, df$nitrogen, df$variety),mean) # 分組匯總df數(shù)據(jù)框v1列克蚂。
df1 # 顯示結(jié)果
##   Group.1 Group.2 Group.3        x
## 1    2020      N1       a 1.253333
## 2    2021      N1       a 1.213333
## 3    2020      N2       a 1.316667
## 4    2021      N2       a 1.406667
## 5    2020      N1       b 1.093333
## 6    2021      N1       b 1.240000
## 7    2020      N2       b 1.303333
## 8    2021      N2       b 1.223333
plot(density(df1$x)) # 簡(jiǎn)單顯示峰度和偏度闺鲸。
image.png
boxplot(df$v1) # 單變量箱線圖。
image.png
boxplot(df$v1 ~ df$year) # 按分組顯示變量箱線圖埃叭。
image.png

參考資料:

  1. 《R語言實(shí)戰(zhàn)》(中文版)摸恍,人民郵電出版社,2013.
  2. 偏度和峰度赤屋,https://zhuanlan.zhihu.com/p/84614017
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末立镶,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子类早,更是在濱河造成了極大的恐慌媚媒,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件涩僻,死亡現(xiàn)場(chǎng)離奇詭異缭召,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)逆日,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門嵌巷,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人室抽,你說我怎么就攤上這事搪哪。” “怎么了狠半?”我有些...
    開封第一講書人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵噩死,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我神年,道長(zhǎng)已维,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任已日,我火速辦了婚禮垛耳,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己堂鲜,他們只是感情好栈雳,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著缔莲,像睡著了一般哥纫。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上痴奏,一...
    開封第一講書人閱讀 49,111評(píng)論 1 285
  • 那天蛀骇,我揣著相機(jī)與錄音,去河邊找鬼读拆。 笑死擅憔,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的檐晕。 我是一名探鬼主播暑诸,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼辟灰!你這毒婦竟也來了个榕?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤伞矩,失蹤者是張志新(化名)和其女友劉穎笛洛,沒想到半個(gè)月后夏志,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體乃坤,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年沟蔑,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡少漆,死狀恐怖侧馅,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情食棕,我是刑警寧澤朗和,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布,位于F島的核電站簿晓,受9級(jí)特大地震影響眶拉,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜憔儿,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一忆植、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦朝刊、人聲如沸耀里。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽冯挎。三九已至,卻和暖如春咙鞍,著一層夾襖步出監(jiān)牢的瞬間织堂,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來泰國(guó)打工奶陈, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留易阳,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓吃粒,卻偏偏與公主長(zhǎng)得像潦俺,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子徐勃,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容