1. 拿小本本記下的
(1)R的賦值符號(hào) <-
(2)在控制臺(tái)輸入命令领斥,相當(dāng)于Linux的命令行
(3)R的代碼是帶括號(hào)的,括號(hào)必須是英文梦湘。
(4)顯示工作路徑 getwd()
(5)向量由元素組成瞎颗,元素可以是數(shù)字或者字符串件甥。
(6)表格在R語(yǔ)言中叫數(shù)據(jù)框
(7)復(fù)制代碼時(shí),要理解其中的命令言缤、函數(shù)的意思嚼蚀。
函數(shù)或者命令不會(huì)用時(shí)
除了百度/谷歌搜索以外禁灼,用這個(gè)命令查看幫助:?read.table
調(diào)出對(duì)應(yīng)的幫助文檔管挟,翻到example部分研究一下~
(8)數(shù)據(jù)類型
- 向量(vector)* * *
- 矩陣(Matrix)
- 數(shù)組(Array)
- 數(shù)據(jù)框(Data frame)* * *
- List
生信學(xué)習(xí)者最需要熟悉的是向量和數(shù)據(jù)框。
2. 向量
1. 標(biāo)量和向量的區(qū)分
元素:指數(shù)字或者字符串(用chr表示)等
標(biāo)量:一個(gè)元素組成的變量
向量:多個(gè)元素組成的變量
(一個(gè)向量是一排有序排列的元素)
- 使用時(shí)會(huì)給變量定義(賦值)
x<- c(1,2,3) #常用的向量寫法弄捕,意為將x定義為由元素1僻孝,2,3組成的向量守谓。
x
x<- 1:10 #從1-10之間所有的整數(shù)
x
x<- seq(1,10,by = 0.5) #1-10之間每隔0.5取一個(gè)數(shù)(注意是逗號(hào)不是分號(hào))
x
x<- rep(1:3,times=2) #1-3 重復(fù)2次
x
(每行下輸入x是查看他)
這樣的:
> x <- seq(1,10,by = 0.5)
> x
[1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0
[8] 4.5 5.0 5.5 6.0 6.5 7.0 7.5
[15] 8.0 8.5 9.0 9.5 10.0
> x <- rep(1:3,times = 2)
> x
[1] 1 2 3 1 2 3
-
查看變量
輸入命令View(x)
x是變量穿铆,View大寫!U瘛荞雏!
——這里x被賦值四次,所以最后一次才是結(jié)果
2. 從向量中提取元素
(1)根據(jù)元素位置
> x<- rep(1:3,times=2) #1-3 重復(fù)2次
> x
[1] 1 2 3 1 2 3
> x[4]
[1] 1
> x[-4]
[1] 1 2 3 2 3
> x[2:4]
[1] 2 3 1
> x[-(2:4)]
[1] 1 2 3
> x[c(1,5)]
[1] 1 2
(2)根據(jù)值
> x[x==10]
integer(0)
> x[x<0]
integer(0)
> x[x%in%c(1,2,5)] #打不打空格好像都可以
[1] 1 2 1 2
> x[x %in% c(1,2,5)]
[1] 1 2 1 2
3. 數(shù)據(jù)框
把本地?cái)?shù)據(jù)放在工作目錄下F侥稹凤优!
獲得示例數(shù)據(jù)框:x <- read.csv('doudou.txt')
1. 讀取本地?cái)?shù)據(jù)
輸入命令
> read.table(file = "huahua.txt",sep = "\t",header = T)
> a <- read.table(file = "huahua.txt",sep = "\t",header = T)
例如:
> read.table(file = "huahua.txt",sep = "\t",header = T)
X1 X2
1 A 1
2 B NA
3 C NA
4 D 3
5 E NA
> a <- read.table(file = "huahua.txt",sep = "\t",header = T) #a賦值,兩種方式一樣
> a
X1 X2
1 A 1
2 B NA
3 C NA
4 D 3
5 E NA
a賦值蜈彼,兩種方式一樣
理解參數(shù)sep,header筑辨,用幫助文檔?read.table
``
2. 設(shè)置行名和列名
X<-read.csv('doudou.txt') #在示例數(shù)據(jù)里有doudou.txt 注意這里的變量X是一個(gè)數(shù)據(jù)框
colnames(X) #查看列名
rownames(X) #查看行名,默認(rèn)值的行名就是行號(hào),1.2.3.4...
colnames(X)[1]<-"bioplanet"#有的公司返回?cái)?shù)據(jù)幸逆,左上角第一格為空棍辕,R會(huì)自動(dòng)補(bǔ)為x,用這個(gè)命令來(lái)修改
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#最后row.names的意思是修改第一列為行名
大小寫嚴(yán)格區(qū)分
3. 數(shù)據(jù)框的導(dǎo)出
write.table(X,file = "yu.txt",sep = ",",quote=F)#分隔符改為逗號(hào),字符串不加雙引號(hào)(默認(rèn)格式帶由雙引號(hào))
4. 變量的保存與重新加載
沒有處理完的數(shù)據(jù)下次接著用——學(xué)會(huì)保存和重新加載还绘。保存的格式是RData楚昭。
save.image(file="bioinfoplanet.RData")#保存當(dāng)前所有變量
save(X,file="test.RData")#保存其中一個(gè)變量
load("test.RData")#再次使用RData時(shí)的加載命令
5. 提取元素
- X[x,y]#第x行第y列
- X[x,]#第x行
- X[,y]#第y列
- X[y] #也是第y列
- X[a:b]#第a列到第b列
- X[c(a,b)]#第a列和第b列
- X$列名#也可以提取列(優(yōu)秀寫法,而且這個(gè)命令還優(yōu)秀到不用寫括號(hào)的地步拍顷,并且支持Tab自動(dòng)補(bǔ)全哦哪替,不過(guò)只能提取一列)
> a[1,2]
[1] 1
> a[1,]
X1 X2
1 A 1
> a[,2]
[1] 1 NA NA 3 NA
> a[2]
X2
1 1
2 NA
3 NA
4 3
5 NA
> a[1:1]
X1
1 A
2 B
3 C
4 D
5 E
> a[c(2,2)]
X2 X2.1
1 1 1
2 NA NA
3 NA NA
4 3 3
5 NA NA
> a$X2
[1] 1 NA NA 3 NA
4. 選修. 直接使用數(shù)據(jù)框中的變量
1.提取某兩列做散點(diǎn)圖
a <-data.frame(case=paste("S",1:50),values=runif(50)) #1:50(1到50所有整數(shù)) runif(這里是生成0~1之間的隨機(jī)數(shù))
plot(a$case,a$values) #繪圖
case和values是列名,是用以上命令隨便畫的一個(gè)圖
- 高效法1
attach()
attach(a) #將數(shù)據(jù)框名a添加到搜索環(huán)境中
plot(case,values) #直接輸入列名菇怀,無(wú)需$
完成后將a刪除搜索環(huán)境 detach(a)
兩個(gè)以上數(shù)據(jù)框列名沖突凭舶,attach報(bào)錯(cuò)
- 高效法2
with
with(a,{
plot(case,values)
x<<-summary(values) #求和并賦值給x,<<的意思是作為全局變量,也就是出了大括號(hào)仍有效爱沟。
})
x #運(yùn)行完后打印x
一篇很好的解釋~with(), within() 和 transform()的簡(jiǎn)單比較
5. 思考題
save(X,file="test.RData")
,這句代碼如果報(bào)錯(cuò)X not found帅霜,是為什么,應(yīng)該怎么解決呼伸?
1身冀、檢查是否因?yàn)榇笮憥?lái)的錯(cuò)誤
2钝尸、對(duì)X重新進(jìn)行賦值即可