注意事項(xiàng)
- R的代碼都是帶括號的跨晴,括號必須是英文的
- 向量是由元素組成的,元素可以是數(shù)字或者字符串
- 表格在R語言中改名叫數(shù)據(jù)框
- 函數(shù)或者命令不會(huì)用時(shí)片林,除了百度/谷歌搜索以外端盆,用這個(gè)命令查看幫助:
?read.table,調(diào)出對應(yīng)的幫助文檔费封,翻到example部分研究一下
PART1 向量
1. 標(biāo)量和向量的區(qū)分
- 標(biāo)量:一個(gè)元素組成的變量
-標(biāo)量可以是一個(gè)數(shù)字或者字符串(使用時(shí)必須加引號“花花”) - 向量:多個(gè)元素組成的變量(一個(gè)向量是一排有序排列的元素)
- 舉例
x<- c(1,2,3)
x<- 1:10
x<- seq(1,10,by = 0.5)
x<- rep(1:3,times=2)
2. 從向量中提取元素
- 根據(jù)元素的位置
x[4] #x第4個(gè)元素
x[-4] #排除法焕妙,除了第4個(gè)元素之外剩余的元素
x[2:4] #第2到4個(gè)元素
x[-(2:4) ]#除了第2-4個(gè)元素
x[c(1,5)] #第1個(gè)和第5個(gè)元素
- 根據(jù)值
x[x==10]#等于10的元素
x[x<0]
x[x %in% c( 1,2,5)] #存在于向量c(1,2弓摘,5)中的元素
PART2 數(shù)據(jù)框
1. 讀取示例數(shù)據(jù)
X<-read.csv('doudou.txt')
View(X)
read.table(file = "huahua.txt",sep = "\t",header =T)
a<- read.table(file = "huahua.txt",sep = "\t",header =T)
2. 設(shè)置行名和列名
- X<-read.csv('doudou.txt')
- colnames(X) 查看列名
- rownames(X) #查看行名
- colnames(X)[1]<-"bioplanet"#有的公司返回?cái)?shù)據(jù)焚鹊,左上角第一格為空,R會(huì)自動(dòng)補(bǔ)為x,用這個(gè)命令來修改
- X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1) #最后row.names的意思是修改第一列為行名
3. 數(shù)據(jù)框的導(dǎo)出
write.table(X,file = "yu.txt",sep = ",",quote=F) #分隔符改為逗號韧献,字符串不加雙引號(默認(rèn)格式帶由雙引號)
4. 變量的保存與重新加載
- 保存的格式是RData
- save.image(file="bioinfoplanet.RData") #保存當(dāng)前所有變量
- save(X,file="test.RData")#保存其中一個(gè)變量
- load("test.RData") #再次使用RData時(shí)的加載命令
5. 提取元素
- X[x,y]#第x行第y列
- X[x,]#第x行
- X[,y]#第y列
- X[y] #也是第y列
- X[a:b]#第a列到第b列
- X[c(a,b)]#第a列和第b列
X$列名 #提取列( 只能提取一列)
6. 直接使用數(shù)據(jù)框中的變量
- 提取某兩列作散點(diǎn)圖
- options(stringsAsFactors = T)
- a <-data.frame (case=paste0("S",1:9), values=runif(9))
- plot(avalues)
- 避免數(shù)據(jù)框名a重復(fù)出現(xiàn)的方法
-
數(shù)據(jù)框名添加到搜索環(huán)境中:attach(a)末患。做完后將a刪除出搜索環(huán)境 detach(a)研叫。但是兩個(gè)以上數(shù)據(jù)框的列名有沖突時(shí),同時(shí)attach會(huì)報(bào)錯(cuò)
-
with
作業(yè)
save(X,file="test.RData")這句代碼如果報(bào)錯(cuò)object X not found是為什么阻塑,應(yīng)該怎么解決蓝撇?
答:可能是X的大小寫問題,或者未賦值變量X