思維導(dǎo)圖
學(xué)習(xí)要點----R語言重要的兩個數(shù)據(jù)類型
part 1:向量
向量:多個元素組成的變量
幾種賦值向量的方法
a <- c(1, 2, 3)
#常用的向量定義寫法,意為將x定義為由元素1校坑,2轧飞,3組成的向量衅鹿。
a <- (1: 10)
#從1-10之間所有的整數(shù)
a <- seq(1, 10, by = 0.5)
#1-10之間每隔0.5取一個數(shù)(注意這里是逗號不是分號)
a <- rep(1: 3, times = 2)
#1-3 重復(fù)2次
從向量中提取元素
根據(jù)元素位置
x[4]
#x第4個元素
x[-4]
#排除法,除了第4個元素之外剩余的元素
x[2: 4]
#第2到4個元素
x[-(2:4)]
#除了……
x[c(1, 5)]
#第1個和第5個元素
根據(jù)值的大小
x[x == 10]
#等于10的元素
x[x < 0]
x[x %in% c(1, 2, 5)]
#存在于向量c(1过咬,2大渤,5)中的元素
注:x[x %in% c(1, 2, 5)]
也可以簡單理解為c在x中的真子集。
part 2:數(shù)據(jù)框
(1)讀取本地數(shù)據(jù)
read.table(file = "huahua.txt",sep = "\t",header =T)
讀取文件掸绞,分隔符為Tab泵三,有表頭
a<-read.table(file = "huahua.txt",sep = "\t",header =T)
把這個數(shù)據(jù)框賦給一個變量a
(2)設(shè)置行名和列名
X<-read.csv('doudou.txt')
#在示例數(shù)據(jù)里有doudou.txt 注意這里的變量X是一個數(shù)據(jù)框
colnames(X)
#查看列名
rownames(X)
#查看行名,默認值的行名就是行號,1.2.3.4...
colnames(X)[1]<-"bioplanet"
#有的公司返回數(shù)據(jù)衔掸,左上角第一格為空烫幕,R會自動補為x,用這個命令來修改
X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1)
#最后row.names的意思是修改第一列為行名
(3)數(shù)據(jù)框的導(dǎo)出
write.table(X,file = "yu.txt",sep = ",",quote=F)
#分隔符改為逗號,字符串不加雙引號(默認格式帶由雙引號)
(4)變量的保存與重新加載
save.image(file="bioinfoplanet.RData")
#保存當(dāng)前所有變量
save(frame1,file="frame1.RData")
#保存其中一個變量
load("frame1.RData")
#再次使用RData時的加載命令
保存的格式是RData敞映。
(5)提取元素
X[x,y]
#第x行第y列
X[x,]
#第x行
X[,y]
#第y列
X[y]
#第y列
X[a:b]
#第a列到第b列
X[c(a,b)]
#第a列和第b列
X$
列名#也可以提取列
(6)直接使用數(shù)據(jù)框中的變量
例:提取兩列作散點圖
c <-data.frame(case=paste("S",c(1:50)),values=runif(50))
> plot(c$case,c$values)
其他方法:
方法一 attach
attach(c)
plot(case,values)
方法二 with
with(c,{
+ plot(case,values)
x<<-summary(values)
#求和并賦值給x,<<的意思是作為全局變量较曼,y也就是出了with循環(huán)仍有效。
})
x
#運行完后打印x
學(xué)習(xí)體會
Day5的學(xué)習(xí)著實費勁一些振愿,又生病捷犹,真是沒愛了。還有兩天冕末,爭取多學(xué)一點萍歉,畢竟這幾天不用像之前那樣天天摸瞎了。