R數(shù)據(jù)結(jié)構(gòu)
1、R中的賦值符號是 <- ,不是=
2碘裕、Console控制臺輸入命令,相當(dāng)于Linux的command line
3攒钳、括號注意使用都是英文半角括號
4帮孔、顯示工作路徑 get()
5、向量是由元素組成的不撑,可以使數(shù)字或字符串
6文兢、表格在R中為數(shù)據(jù)框
7、數(shù)據(jù)類型主要看:向量(vector)和數(shù)據(jù)框(Data frame)
向量
標(biāo)量和向量
標(biāo)量:一個元素組成的變量
向量:多個元素組成的變量焕檬,一排有序排列的元素姆坚。
賦值:給變量定義。
從向量中提取元素
根據(jù)元素位置
x[4] #x第4個元素
x[-4]#排除法兼呵,除了第4個元素之外剩余的元素
x[2:4]#第2到4個元素
x[-(2:4)]#除了第2-4個元素
x[c(1,5)] #第1個和第5個元素
根據(jù)值
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2腊敲,5)中的元素
數(shù)據(jù)框
讀取本地文件
> getwd()
[1] "/Users/yuxiyang/Desktop"
> read.csv(file="huahua.txt", sep = "\t", header = TRUE)
X1 X2
1 A 1
2 B NA
3 C NA
4 D 3
5 E NA
設(shè)置行名击喂、列名
> a <- read.csv(file="huahua.txt", sep = "\t", header = TRUE)
> colnames(a)
[1] "X1" "X2"
> rownames(a)
[1] "1" "2" "3" "4" "5"
> colnames(a)[1] <- "bioplanet"
> x <- read.csv(file="huahua.txt", sep = "\t", header = TRUE, row.names = 1)
> colnames(x)
[1] "X2"
數(shù)據(jù)框的導(dǎo)出
> write.table(x,file = "yu.txt",sep = ",",quote=F)
變量保存與加載
> save(x,file="test.RData")#保存其中一個變量
> load("test.RData")#再次使用RData時的加載命令
提取元素
X[x,y]#第x行第y列
X[x,]#第x行
X[,y]#第y列
X[y] #也是第y列
X[a:b]#第a列到第b列
X[c(a,b)]#第a列和第b列
X$列名#也可以提取列(優(yōu)秀寫法,而且這個命令還優(yōu)秀到不用寫括號的地步碰辅,并且支持Tab自動補全哦茫负,不過只能提取一列)
直接使用數(shù)據(jù)框變量
options(stringsAsFactors = T)
a <-data.frame(case=paste0("S",1:9),values=runif(9))
plot(a$case,a$values)
attach()
attach(a)
plot(case,values)
deattach(a)
with()
with(a,{
plot(case,values)
x<<-summary(values) #求和并賦值給x,<<的意思是作為全局變量,也就是出了大括號仍有效乎赴。
})
x #運行完后打印x
課后作業(yè)
save(X,file="test.RData")忍法,這句代碼如果報錯object X not found潮尝,是為什么,應(yīng)該怎么解決饿序?
查找變量X勉失,第一確定有變量X,其次注意區(qū)分變量大小寫原探。