barplot(a)? #直方圖 數(shù)值型變量--每一個(gè)獨(dú)立? ? ? VS? ? hist(a)? #畫(huà)直方圖
barplot(table(a))? #頻數(shù)分布直方圖?
stem(a)? #莖葉圖
boxplot (a) #箱線圖
plot()? ? #散點(diǎn)圖
mean(mpg)? ?# 計(jì)算平均值
mean(mpg,trim=.1)? ? ?# 計(jì)算截去10%的平均值
tapply(mpg,cyl,mean)? ?#按分組變量cyl計(jì)算mpg的分組平均數(shù)??
IQR(mpg)? ??# 計(jì)算四分位數(shù)的極差
quantile(mpg)? ?=? fivenum(mpg)? ? ? # 計(jì)算樣本常用的分位數(shù):極小稍刀、極大幸缕、中位數(shù)及兩個(gè)四分位數(shù)quantile(mpg, probs=c(0.1,0.25,0.75))? ? ?#計(jì)算由向量prob給定的各概率處的樣本分位數(shù)(10%.25%.75%)
summary(mpg)? ?#最小值、第一四分位數(shù)血崭、中位數(shù)岩臣、平均數(shù)、第三分位數(shù)和最大值
sd()? ?#標(biāo)準(zhǔn)差? ? ?var()? ?#方差? ?mad()? #中位絕對(duì)離差
z=lm(cyl~mpg)? ? ?# 擬合線性回歸(注意:用~分割,不是逗號(hào))
cor(cyl,mpg)? ??# 相關(guān)系數(shù)
# 殘差分析
lm.res=lm(cyl~mpg)? ?# 將回歸分析的結(jié)果作為對(duì)象,保存到 lm.res?
lm.resids=resid(lm.res)? # 提取殘差向量
plot(lm.resids)# 考察殘差的散點(diǎn)圖
hist(lm.resids)# 考察殘差的直方圖
qqnorm(lm.resids)# 殘差的QQ圖是否落在直線上
ls()函數(shù)顯示所有在內(nèi)存中的對(duì)象转培,ls.str()顯示所有對(duì)象的詳細(xì)信息
?rm()? ? ?# 刪除對(duì)象使用?
rm(x)? 刪除對(duì)象x
rm(x, y)刪除對(duì)象x,y
rm(list=ls())刪除內(nèi)存中所有對(duì)象
rm(list=ls(pat="^m"))? ? ?刪除對(duì)象以字母m開(kāi)頭的對(duì)象
rep(x, time = , length = , each = ,)? ? ?rep表示重復(fù)的意思?浆竭?浸须?
?examples:
? ? ?> rep(1:4, 2)
? ? [1] 1 2 3 4 1 2 3 4
? ? > rep(1:4, each = 2)
? ? [1] 1 1 2 2 3 3 4 4
? ? > rep(1:4, each = 2, len = 10)
? ? [1] 1 1 2 2 3 3 4 4 1 1
rep(c(3,5),c(2,4))? #表示出2遍3,,4遍5??
所有轉(zhuǎn)化為因子都用factor()? ? ? 再轉(zhuǎn)化為數(shù)值因子levels(a)=c(1,2,3,4)
函數(shù)gl()能產(chǎn)生規(guī)則的因子序列,用法為gl(k,n)特碳,其中k是水平數(shù)诚亚,n是每個(gè)水平重復(fù)次數(shù)。length選項(xiàng)指定產(chǎn)生數(shù)據(jù)的個(gè)數(shù)午乓,label指定水平因子的名字站宗。
數(shù)組 array?
格式:? ?array(data,dim,dimnames)
data為向量或辖,其元素用于構(gòu)建數(shù)組;dim為數(shù)組的維數(shù)向量(數(shù)值型)枣接;dimnames為各維度名稱構(gòu)成的向量颂暇,缺省為空。
矩陣 matrix
x=matrix(1:12,nr=3,nc=4)? ? #表示從1-12之間取值但惶,填充3行耳鸯,4列。
diag()? ? #生成單位陣
合并表格
# 變量之間的關(guān)系可以通過(guò)成對(duì)數(shù)據(jù)散點(diǎn)圖考查? pairs(Puromycin,panel=panel.smooth) xtabs (~mpg+disp,data=文件)? ? ?#xtabs是根據(jù)分類(lèi)因子形成一個(gè)列連表
數(shù)據(jù)框添加新變量
字符向量的建立
z = c("green", "bluesky", "-99")
labs=paste("x",1:10,seq=",")? ? ? #x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
labs=paste("x,y",1:3)? ? ? ? #xy1 xy2 xy3
labs=paste("x,y",1:3,seq=",")? ? ? ? ?#x,y1? ?x,y2? ? x,y3
補(bǔ)充:
a=c("M","F","M","F","M","M")? ? ? ? ? #table表示分類(lèi)計(jì)數(shù)(頻數(shù))
table(a)
a
F M
2 4
數(shù)據(jù)框的建立
a=c(41,22,23,43,52)
b=1:5
b=data.frame("性別"=b,"年齡"=a)?
#建立了兩縱行(性別,年齡)添谊,性別=1财喳,2,3,4,5耳高,年齡=41,22,23,43,52
正態(tài)分布函數(shù)rnorm()
泊送分布函數(shù)rpois()
指數(shù)分布函數(shù)rexp()
Gamma分?jǐn)?shù)函數(shù)rgamma()
均勻分布函數(shù)runif()
二項(xiàng)分布函數(shù)rbinom()
幾何分布函數(shù)rgeom()
rbind(x1, x2)? 注:r是row的意思扎瓶,即行,按行組成矩陣泌枪。
cbind(x1, x2)? 注c是column的意思概荷,即列,按列組成矩陣碌燕。
apply(x, 2, mean)? --對(duì)x在列的方向求平均值误证,如果2改成1則對(duì)行求平均值
安裝包代碼?
#if (!requireNamespace("BiocManager", quietly = TRUE))
#install.packages("BiocManager")
#BiocManager::install("pheatmap")