數(shù)據(jù)準(zhǔn)備
df <- read.table(file = "D:/Documents/R wd/df.csv", header = T, sep = ",", colClasses = c(year = "character", nitrogen = "character", variety = "character", block = "character")) # 數(shù)據(jù)導(dǎo)入禁舷。
df # 查看數(shù)據(jù)彪杉。
## year nitrogen variety block v1 v2 v3 v4
## 1 2020 N1 a 1 1.26 2.14 3.4 4.66
## 2 2020 N1 a 2 1.20 2.90 4.1 5.30
## 3 2020 N1 a 3 1.30 3.00 4.3 5.60
## 4 2020 N1 b 1 1.08 1.72 2.8 3.88
## 5 2020 N1 b 2 1.05 1.65 2.7 3.75
## 6 2020 N1 b 3 1.15 1.35 2.5 3.65
## 7 2020 N2 a 1 1.32 3.78 5.1 6.42
## 8 2020 N2 a 2 1.28 4.32 5.6 6.88
## 9 2020 N2 a 3 1.35 3.95 5.3 6.65
## 10 2020 N2 b 1 1.33 3.47 4.8 6.13
## 11 2020 N2 b 2 1.28 2.72 4.0 5.28
## 12 2020 N2 b 3 1.30 3.90 5.2 6.50
## 13 2021 N1 a 1 1.19 3.61 4.8 5.99
## 14 2021 N1 a 2 1.21 3.29 4.5 5.71
## 15 2021 N1 a 3 1.24 3.26 4.5 5.74
## 16 2021 N1 b 1 1.09 2.71 3.8 4.89
## 17 2021 N1 b 2 1.28 2.32 3.6 4.88
## 18 2021 N1 b 3 1.35 1.95 3.3 4.65
## 19 2021 N2 a 1 1.45 4.35 5.8 7.25
## 20 2021 N2 a 2 1.40 3.80 5.2 6.60
## 21 2021 N2 a 3 1.37 4.23 5.6 6.97
## 22 2021 N2 b 1 1.28 2.72 4.0 5.28
## 23 2021 N2 b 2 1.15 3.35 4.5 5.65
## 24 2021 N2 b 3 1.24 3.46 4.7 5.94
第7章 基本統(tǒng)計(jì)分析
7.1 描述性統(tǒng)計(jì)分析
7.1.1 方法云集
對(duì)于基礎(chǔ)安裝毅往,你可以使用summary()函數(shù)來獲取描述性統(tǒng)計(jì)量。
summary()函數(shù)提供了最小值派近、最大值攀唯、四分位數(shù)和數(shù)值型變量的均值,以及因子向量和邏輯型向量的頻數(shù)統(tǒng)計(jì)渴丸。
summary(df[,5:8]) # summary函數(shù)計(jì)算df數(shù)據(jù)集5到8列的描述性統(tǒng)計(jì)量侯嘀。
## v1 v2 v3 v4
## Min. :1.050 Min. :1.350 Min. :2.500 Min. :3.650
## 1st Qu.:1.198 1st Qu.:2.612 1st Qu.:3.750 1st Qu.:4.888
## Median :1.280 Median :3.275 Median :4.500 Median :5.680
## Mean :1.256 Mean :3.081 Mean :4.338 Mean :5.594
## 3rd Qu.:1.323 3rd Qu.:3.785 3rd Qu.:5.125 3rd Qu.:6.440
## Max. :1.450 Max. :4.350 Max. :5.800 Max. :7.250
sapply(x, FUN, options)
x:數(shù)據(jù)框(或矩陣);
FUN為一個(gè)任意的函數(shù)谱轨。如果指定了options戒幔,它們將被傳遞給FUN。
## 通過sapply函數(shù)計(jì)算描述性統(tǒng)計(jì)土童。
mystats <- function(x, na.omit=FALSE){
if(na.omit)
x <- x[!is.na(x)]
n <- length(x)
m <- mean(x)
s <- sd(x)
skew <- sum((x-m)^3/s^3)/n
kurt <- sum((x-m)^4/s^4)/n-3
return(c(n=n, mean=m, stdev=s, skew=skew, kurtosis=kurt))
} # 定義描述性統(tǒng)計(jì)的函數(shù)诗茎,n為樣本量,m為平均值献汗,s為標(biāo)準(zhǔn)差敢订,skew為偏度,kurt為峰度罢吃。
sapply(df[5:8], mystats) # sapply函數(shù)描述性統(tǒng)計(jì)楚午。
## v1 v2 v3 v4
## n 24.0000000 24.0000000 24.0000000 24.0000000
## mean 1.2562500 3.0812500 4.3375000 5.5937500
## stdev 0.1018017 0.8771957 0.9430812 1.0149183
## skew -0.2991286 -0.3609173 -0.3371765 -0.3209242
## kurtosis -0.6567661 -1.0459573 -0.9674555 -0.8823974
擴(kuò)展學(xué)習(xí)-偏度和峰度
1 偏度
偏度(Skewness)可以用來度量隨機(jī)變量概率分布的不對(duì)稱性。公式如下:
其中是均值尿招,是標(biāo)準(zhǔn)差矾柜。
偏度的取值范圍為(-∞,+∞)
當(dāng)偏度<0時(shí),概率分布圖左偏就谜。
當(dāng)偏度=0時(shí)把沼,表示數(shù)據(jù)相對(duì)均勻的分布在平均值兩側(cè),不一定是絕對(duì)的對(duì)稱分布吁伺。
當(dāng)偏度>0時(shí)饮睬,概率分布圖右偏。
2 峰度
峰度(Kurtosis)可以用來度量隨機(jī)變量概率分布的陡峭程度篮奄。公式:
其中是均值捆愁,是標(biāo)準(zhǔn)差割去。
峰度的取值范圍為[1,+∞),完全服從正態(tài)分布的數(shù)據(jù)的峰度值為3昼丑,峰度值越大呻逆,概率分布圖越高尖,峰度值越小菩帝,越矮胖咖城。
通常我們將峰度值減去3,也被稱為超值峰度(Excess Kurtosis)呼奢,這樣正態(tài)分布的峰度值等于0宜雀,當(dāng)峰度值>0,則表示該數(shù)據(jù)分布與正態(tài)分布相比較為高尖握础,當(dāng)峰度值<0辐董,則表示該數(shù)據(jù)分布與正態(tài)分布相比較為矮胖。
擴(kuò)展
Hmisc包中的describe()函數(shù)可返回變量和觀測(cè)的數(shù)量禀综、缺失值和唯一值的數(shù)目简烘、平均值、分位數(shù)定枷,以及五個(gè)最大的值和五個(gè)最小的值孤澎。
library(Hmisc) # 調(diào)用Hmisc包,調(diào)用前請(qǐng)安裝欠窒。
describe(df$v1) # 顯示結(jié)果覆旭。
## df$v1
## n missing distinct Info Mean Gmd .05 .10
## 24 0 17 0.994 1.256 0.1169 1.082 1.108
## .25 .50 .75 .90 .95
## 1.197 1.280 1.323 1.364 1.395
##
## lowest : 1.05 1.08 1.09 1.15 1.19, highest: 1.33 1.35 1.37 1.40 1.45
##
## Value 1.05 1.08 1.09 1.15 1.19 1.20 1.21 1.24 1.26 1.28 1.30
## Frequency 1 1 1 2 1 1 1 2 1 4 2
## Proportion 0.042 0.042 0.042 0.083 0.042 0.042 0.042 0.083 0.042 0.167 0.083
##
## Value 1.32 1.33 1.35 1.37 1.40 1.45
## Frequency 1 1 2 1 1 1
## Proportion 0.042 0.042 0.083 0.042 0.042 0.042
pastecs包中有一個(gè)名為stat.desc()的函數(shù),它可以計(jì)算種類繁多的描述性統(tǒng)計(jì)量贱迟。 stat.desc(x, basic=TRUE, desc=TRUE, norm=FALSE, p=0.95)
x是一個(gè)數(shù)據(jù)框或時(shí)間序列姐扮。若basic=TRUE(默認(rèn)值),則計(jì)算其中所有值衣吠、空值茶敏、缺失值的數(shù)量,以及最小值缚俏、最大值惊搏、值域,還有總和忧换。若desc=TRUE(同樣也是默認(rèn)值)恬惯,則計(jì)算中位數(shù)、平均數(shù)亚茬、平均數(shù)的標(biāo)準(zhǔn)誤酪耳、平均數(shù)置信度為95%的置信區(qū)間、方差、標(biāo)準(zhǔn)差以及變異系數(shù)碗暗。最后颈将,若norm=TRUE(不是默認(rèn)的),則返回正態(tài)分布統(tǒng)計(jì)量言疗,包括偏度和峰度(以及它們的統(tǒng)計(jì)顯著程度)和Shapiro--Wilk正態(tài)檢驗(yàn)結(jié)果晴圾。這里使用了p值來計(jì)算平均數(shù)的置信區(qū)間(默認(rèn)置信度為0.95)。
library(pastecs) # 調(diào)用pastecs包噪奄。
stat.desc(df$v1, norm=TRUE, p=0.95) # 返回結(jié)果死姚。
## nbr.val nbr.null nbr.na min max range
## 24.00000000 0.00000000 0.00000000 1.05000000 1.45000000 0.40000000
## sum median mean SE.mean CI.mean.0.95 var
## 30.15000000 1.28000000 1.25625000 0.02078019 0.04298709 0.01036359
## std.dev coef.var skewness skew.2SE kurtosis kurt.2SE
## 0.10180170 0.08103618 -0.29912856 -0.31669845 -0.65676606 -0.35780260
## normtest.W normtest.p
## 0.97472260 0.78255589
psych包也擁有一個(gè)名為describe()的函數(shù),它可以計(jì)算非缺失值的數(shù)量勤篮、平均數(shù)都毒、標(biāo)準(zhǔn)差、中位數(shù)叙谨、截尾均值温鸽、絕對(duì)中位差保屯、最小值手负、最大值、值域姑尺、偏度竟终、峰度和平均值的標(biāo)準(zhǔn)誤。
library(psych) # 調(diào)用psych包切蟋。
describe(df$v1) # 返回結(jié)果统捶。
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 24 1.26 0.1 1.28 1.26 0.1 1.05 1.45 0.4 -0.3 -0.66 0.02
7.1.2 分組計(jì)算描述性統(tǒng)計(jì)量
aggregate(x, by=list, FUN) 如果有多個(gè)分組變量,使用by=list(name1=groupvar1, name2=groupvar2, ... ,groupvarN)這樣的語句柄粹。
aggregate(df$v1, by=list(df$year, df$nitrogen, df$variety), FUN=mean) # 分組統(tǒng)計(jì)喘鸟。
## Group.1 Group.2 Group.3 x
## 1 2020 N1 a 1.253333
## 2 2021 N1 a 1.213333
## 3 2020 N2 a 1.316667
## 4 2021 N2 a 1.406667
## 5 2020 N1 b 1.093333
## 6 2021 N1 b 1.240000
## 7 2020 N2 b 1.303333
## 8 2021 N2 b 1.223333
by(data, INDICES, FUN)
data:一個(gè)數(shù)據(jù)框或矩陣;
INDICES:一個(gè)因子或因子組成的列表驻右,定義了分組什黑;
FUN是任意函數(shù)。
myfun <- function(x) {
c(mean = mean(x), sd = sd(x))
} # 定義函數(shù)myfun堪夭。
by(df$v1, df$year, myfun) # 對(duì)df數(shù)據(jù)的v1以year進(jìn)行平均值和標(biāo)準(zhǔn)差的統(tǒng)計(jì)愕把。
## df$year: 2020
## mean sd
## 1.24166667 0.09943781
## ------------------------------------------------------------
## df$year: 2021
## mean sd
## 1.2708333 0.1063834
by(df[,5:8], df[,1:3], summary) # 對(duì)df數(shù)據(jù)的5到8列進(jìn)行描述性統(tǒng)計(jì),以前3列分分組依據(jù)森爽。
## year: 2020
## nitrogen: N1
## variety: a
## v1 v2 v3 v4
## Min. :1.200 Min. :2.14 Min. :3.400 Min. :4.660
## 1st Qu.:1.230 1st Qu.:2.52 1st Qu.:3.750 1st Qu.:4.980
## Median :1.260 Median :2.90 Median :4.100 Median :5.300
## Mean :1.253 Mean :2.68 Mean :3.933 Mean :5.187
## 3rd Qu.:1.280 3rd Qu.:2.95 3rd Qu.:4.200 3rd Qu.:5.450
## Max. :1.300 Max. :3.00 Max. :4.300 Max. :5.600
## ------------------------------------------------------------
## year: 2021
## nitrogen: N1
## variety: a
## v1 v2 v3 v4
## Min. :1.190 Min. :3.260 Min. :4.50 Min. :5.710
## 1st Qu.:1.200 1st Qu.:3.275 1st Qu.:4.50 1st Qu.:5.725
## Median :1.210 Median :3.290 Median :4.50 Median :5.740
## Mean :1.213 Mean :3.387 Mean :4.60 Mean :5.813
## 3rd Qu.:1.225 3rd Qu.:3.450 3rd Qu.:4.65 3rd Qu.:5.865
## Max. :1.240 Max. :3.610 Max. :4.80 Max. :5.990
## ------------------------------------------------------------
## year: 2020
## nitrogen: N2
## variety: a
## v1 v2 v3 v4
## Min. :1.280 Min. :3.780 Min. :5.100 Min. :6.420
## 1st Qu.:1.300 1st Qu.:3.865 1st Qu.:5.200 1st Qu.:6.535
## Median :1.320 Median :3.950 Median :5.300 Median :6.650
## Mean :1.317 Mean :4.017 Mean :5.333 Mean :6.650
## 3rd Qu.:1.335 3rd Qu.:4.135 3rd Qu.:5.450 3rd Qu.:6.765
## Max. :1.350 Max. :4.320 Max. :5.600 Max. :6.880
## ------------------------------------------------------------
## year: 2021
## nitrogen: N2
## variety: a
## v1 v2 v3 v4
## Min. :1.370 Min. :3.800 Min. :5.200 Min. :6.600
## 1st Qu.:1.385 1st Qu.:4.015 1st Qu.:5.400 1st Qu.:6.785
## Median :1.400 Median :4.230 Median :5.600 Median :6.970
## Mean :1.407 Mean :4.127 Mean :5.533 Mean :6.940
## 3rd Qu.:1.425 3rd Qu.:4.290 3rd Qu.:5.700 3rd Qu.:7.110
## Max. :1.450 Max. :4.350 Max. :5.800 Max. :7.250
## ------------------------------------------------------------
## year: 2020
## nitrogen: N1
## variety: b
## v1 v2 v3 v4
## Min. :1.050 Min. :1.350 Min. :2.500 Min. :3.650
## 1st Qu.:1.065 1st Qu.:1.500 1st Qu.:2.600 1st Qu.:3.700
## Median :1.080 Median :1.650 Median :2.700 Median :3.750
## Mean :1.093 Mean :1.573 Mean :2.667 Mean :3.760
## 3rd Qu.:1.115 3rd Qu.:1.685 3rd Qu.:2.750 3rd Qu.:3.815
## Max. :1.150 Max. :1.720 Max. :2.800 Max. :3.880
## ------------------------------------------------------------
## year: 2021
## nitrogen: N1
## variety: b
## v1 v2 v3 v4
## Min. :1.090 Min. :1.950 Min. :3.300 Min. :4.650
## 1st Qu.:1.185 1st Qu.:2.135 1st Qu.:3.450 1st Qu.:4.765
## Median :1.280 Median :2.320 Median :3.600 Median :4.880
## Mean :1.240 Mean :2.327 Mean :3.567 Mean :4.807
## 3rd Qu.:1.315 3rd Qu.:2.515 3rd Qu.:3.700 3rd Qu.:4.885
## Max. :1.350 Max. :2.710 Max. :3.800 Max. :4.890
## ------------------------------------------------------------
## year: 2020
## nitrogen: N2
## variety: b
## v1 v2 v3 v4
## Min. :1.280 Min. :2.720 Min. :4.000 Min. :5.280
## 1st Qu.:1.290 1st Qu.:3.095 1st Qu.:4.400 1st Qu.:5.705
## Median :1.300 Median :3.470 Median :4.800 Median :6.130
## Mean :1.303 Mean :3.363 Mean :4.667 Mean :5.970
## 3rd Qu.:1.315 3rd Qu.:3.685 3rd Qu.:5.000 3rd Qu.:6.315
## Max. :1.330 Max. :3.900 Max. :5.200 Max. :6.500
## ------------------------------------------------------------
## year: 2021
## nitrogen: N2
## variety: b
## v1 v2 v3 v4
## Min. :1.150 Min. :2.720 Min. :4.00 Min. :5.280
## 1st Qu.:1.195 1st Qu.:3.035 1st Qu.:4.25 1st Qu.:5.465
## Median :1.240 Median :3.350 Median :4.50 Median :5.650
## Mean :1.223 Mean :3.177 Mean :4.40 Mean :5.623
## 3rd Qu.:1.260 3rd Qu.:3.405 3rd Qu.:4.60 3rd Qu.:5.795
## Max. :1.280 Max. :3.460 Max. :4.70 Max. :5.940
擴(kuò)展
doBy包中summaryBy()函數(shù)分組計(jì)算描述性統(tǒng)計(jì)量恨豁。
summaryBy(formula, data=dataframe, FUN=function)
formula可接受的格式var1 + var2 + var3 +....+ varN ~ groupvar1 + groupvar2 + groupvar3 +....+ groupvarN.
在~左側(cè)的變量是需要分析的數(shù)值型變量,而右側(cè)的變量是類別型的分組變量爬迟。function可為任何內(nèi)建或用戶自編的R函數(shù)橘蜜。
myfun <- function(x) {
c(mean = mean(x), sd = sd(x))
} # 定義函數(shù)myfun。
library(doBy) # 調(diào)用doBy包付呕。
summaryBy(v1 + v2 ~ year + nitrogen + variety, data = df, FUN = myfun) # 返回結(jié)果计福。
## year nitrogen variety v1.mean v1.sd v2.mean v2.sd
## 1 2020 N1 a 1.253333 0.05033223 2.680000 0.4703190
## 2 2020 N1 b 1.093333 0.05131601 1.573333 0.1965536
## 3 2020 N2 a 1.316667 0.03511885 4.016667 0.2761038
## 4 2020 N2 b 1.303333 0.02516611 3.363333 0.5971879
## 5 2021 N1 a 1.213333 0.02516611 3.386667 0.1939931
## 6 2021 N1 b 1.240000 0.13453624 2.326667 0.3800439
## 7 2021 N2 a 1.406667 0.04041452 4.126667 0.2891943
## 8 2021 N2 b 1.223333 0.06658328 3.176667 0.3992910
psych包中的describe.by()函數(shù)分組計(jì)算概述統(tǒng)計(jì)量捧请。 一個(gè)以上的分組變量時(shí)可以list(groupvar1, groupvar2, ... , groupvarN)
library(psych) # 調(diào)用psych包。
describe.by(df, df$year) # 返回結(jié)果棒搜,計(jì)算df數(shù)據(jù)集5到8列的描述性統(tǒng)計(jì)量疹蛉,分組變量是year。
##
## Descriptive statistics by group
## group: 2020
## vars n mean sd median trimmed mad min max range skew kurtosis
## year* 1 12 1.00 0.00 1.00 1.00 0.00 1.00 1.00 0.00 NaN NaN
## nitrogen* 2 12 1.50 0.52 1.50 1.50 0.74 1.00 2.00 1.00 0.00 -2.16
## variety* 3 12 1.50 0.52 1.50 1.50 0.74 1.00 2.00 1.00 0.00 -2.16
## block* 4 12 2.00 0.85 2.00 2.00 1.48 1.00 3.00 2.00 0.00 -1.74
## v1 5 12 1.24 0.10 1.28 1.25 0.07 1.05 1.35 0.30 -0.78 -0.98
## v2 6 12 2.91 1.01 2.95 2.92 1.32 1.35 4.32 2.97 -0.18 -1.59
## v3 7 12 4.15 1.09 4.20 4.17 1.41 2.50 5.60 3.10 -0.23 -1.60
## v4 8 12 5.39 1.18 5.45 5.42 1.50 3.65 6.88 3.23 -0.28 -1.60
## se
## year* 0.00
## nitrogen* 0.15
## variety* 0.15
## block* 0.25
## v1 0.03
## v2 0.29
## v3 0.32
## v4 0.34
## ------------------------------------------------------------
## group: 2021
## vars n mean sd median trimmed mad min max range skew kurtosis
## year* 1 12 1.00 0.00 1.00 1.00 0.00 1.00 1.00 0.00 NaN NaN
## nitrogen* 2 12 1.50 0.52 1.50 1.50 0.74 1.00 2.00 1.00 0.00 -2.16
## variety* 3 12 1.50 0.52 1.50 1.50 0.74 1.00 2.00 1.00 0.00 -2.16
## block* 4 12 2.00 0.85 2.00 2.00 1.48 1.00 3.00 2.00 0.00 -1.74
## v1 5 12 1.27 0.11 1.26 1.27 0.12 1.09 1.45 0.36 0.06 -1.19
## v2 6 12 3.25 0.73 3.32 3.28 0.80 1.95 4.35 2.40 -0.19 -1.11
## v3 7 12 4.53 0.77 4.50 4.52 0.89 3.30 5.80 2.50 0.09 -1.20
## v4 8 12 5.80 0.82 5.72 5.76 0.95 4.65 7.25 2.60 0.31 -1.20
## se
## year* 0.00
## nitrogen* 0.15
## variety* 0.15
## block* 0.25
## v1 0.03
## v2 0.21
## v3 0.22
## v4 0.24
describe.by(df$v1, list(df$year, df$nitrogen, df$variety)) # 返回結(jié)果力麸,計(jì)算df數(shù)據(jù)v1的描述性統(tǒng)計(jì)量可款,分組變量是year,nitrogen,variety。
##
## Descriptive statistics by group
## : 2020
## : N1
## : a
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 3 1.25 0.05 1.26 1.25 0.06 1.2 1.3 0.1 -0.13 -2.33 0.03
## ------------------------------------------------------------
## : 2021
## : N1
## : a
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 3 1.21 0.03 1.21 1.21 0.03 1.19 1.24 0.05 0.13 -2.33 0.01
## ------------------------------------------------------------
## : 2020
## : N2
## : a
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 3 1.32 0.04 1.32 1.32 0.04 1.28 1.35 0.07 -0.09 -2.33 0.02
## ------------------------------------------------------------
## : 2021
## : N2
## : a
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 3 1.41 0.04 1.4 1.41 0.04 1.37 1.45 0.08 0.16 -2.33 0.02
## ------------------------------------------------------------
## : 2020
## : N1
## : b
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 3 1.09 0.05 1.08 1.09 0.04 1.05 1.15 0.1 0.24 -2.33 0.03
## ------------------------------------------------------------
## : 2021
## : N1
## : b
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 3 1.24 0.13 1.28 1.24 0.1 1.09 1.35 0.26 -0.27 -2.33 0.08
## ------------------------------------------------------------
## : 2020
## : N2
## : b
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 3 1.3 0.03 1.3 1.3 0.03 1.28 1.33 0.05 0.13 -2.33 0.01
## ------------------------------------------------------------
## : 2021
## : N2
## : b
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 3 1.22 0.07 1.24 1.22 0.06 1.15 1.28 0.13 -0.23 -2.33 0.04
7.1.3 結(jié)果的可視化
df1 <- aggregate(df$v1, by = list(df$year, df$nitrogen, df$variety),mean) # 分組匯總df數(shù)據(jù)框v1列克蚂。
df1 # 顯示結(jié)果
## Group.1 Group.2 Group.3 x
## 1 2020 N1 a 1.253333
## 2 2021 N1 a 1.213333
## 3 2020 N2 a 1.316667
## 4 2021 N2 a 1.406667
## 5 2020 N1 b 1.093333
## 6 2021 N1 b 1.240000
## 7 2020 N2 b 1.303333
## 8 2021 N2 b 1.223333
plot(density(df1$x)) # 簡(jiǎn)單顯示峰度和偏度闺鲸。
boxplot(df$v1) # 單變量箱線圖。
boxplot(df$v1 ~ df$year) # 按分組顯示變量箱線圖埃叭。
參考資料:
- 《R語言實(shí)戰(zhàn)》(中文版)摸恍,人民郵電出版社,2013.
- 偏度和峰度赤屋,https://zhuanlan.zhihu.com/p/84614017