1.向量
首先明確“元素”的意思,元素指的是數(shù)字或者字符串(用chr表示)等祝懂,根據(jù)它可以區(qū)分兩個(gè)詞:
標(biāo)量:一個(gè)元素組成的變量
向量:多個(gè)元素組成的變量
(補(bǔ)充:一個(gè)向量是一排有序排列的元素檬输,以后會(huì)用到把一個(gè)向量作為數(shù)據(jù)框中的一列的情況隙姿。)
x<- c(1,2,3) #常用的向量寫法户敬,意為將x定義為由元素1荣茫,2想帅,3組成的向量。
x
#[1] 1 2 3
x<- 1:10 #從1-10之間所有的整數(shù)
x
#[1] 1 2 3 4 5 6 7 8 9 10
x<- seq(1,10,by = 0.5) #1-10之間每隔0.5取一個(gè)數(shù)(注意是逗號(hào)不是分號(hào))
x
#1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0
x<- rep(1:3,times=2) #1-3 重復(fù)2次
x
# 1 2 3 1 2 3
2.從向量中提取元素
(1)根據(jù)元素位置
#這里的x是你剛才賦值的變量名啡莉,根據(jù)自己的情況來修改
x[4] #x第4個(gè)元素
x[-4]#排除法港准,除了第4個(gè)元素之外剩余的元素
x[2:4]#第2到4個(gè)元素
x[-(2:4)]#除了第2-4個(gè)元素
x[c(1,5)] #第1個(gè)和第5個(gè)元素
(2)根據(jù)值
x[x==10]#等于10的元素
x[x<0]#小于0的元素
x[x %in% c(1,2,5)]#存在于向量c(1,2咧欣,5)中的元素
Part2:數(shù)據(jù)框
(1)讀取本地?cái)?shù)據(jù)
sep浅缸,header是比較常用的參數(shù),可以看幫助文檔嘗試?yán)斫馑鼈兊囊馑?/p>
(2)設(shè)置行名和列名
b<-read.csv('doudou.txt') #在示例數(shù)據(jù)里有doudou.txt 注意這里的變量X是一個(gè)數(shù)據(jù)框
colnames(b) #查看列名
#"X1" "X2"
rownames(b) #查看行名,默認(rèn)值的行名就是行號(hào)1.2.3.4...
#"1" "2" "3" "4" "5"
colnames(b)[1]<-"bioplanet"#有的公司返回?cái)?shù)據(jù)魄咕,左上角第一格為空衩椒,R會(huì)自動(dòng)補(bǔ)為x,用這個(gè)命令來修改
d<-read.csv(file = "huahua.txt",sep = "",header =T,row.names=1)
#最后row.names的意思是修改第一列為行名
(3)數(shù)據(jù)框的導(dǎo)出
write.table(X,file = "yu.txt",sep = ",",quote=F)
#分隔符改為逗號(hào),字符串不加雙引號(hào)(默認(rèn)格式帶由雙引號(hào))
(4)變量的保存與重新加載
#這次沒有處理完的數(shù)據(jù)下次想接著用怎么辦?
#--學(xué)會(huì)保存和重新加載哮兰。保存的格式是RData
save.image(file="bioinfoplanet.RData")
#保存當(dāng)前所有變量
save(X,file="test.RData")
#保存其中一個(gè)變量
load("test.RData")#再次使用RData時(shí)的加載命令
(5)提取元素
- b[x,y]#第x行第y列
- b[x,]#第x行
- b[,y]#第y列
- b[y] #也是第y列
- b[a:b]#第a列到第b列
- b[c(a,b)]#第a列和第b列
- b$列名 #也可以提取列(優(yōu)秀寫法毛萌,而且這個(gè)命令還優(yōu)秀到不用寫括號(hào)的地步,并且支持Tab自動(dòng)補(bǔ)全哦喝滞,不過只能提取一列)
(6)【選修部分】直接使用數(shù)據(jù)框中的變量
提取某兩列作散點(diǎn)圖:
(需要提示一下阁将,這里的case和values是兩個(gè)單純的列名,沒別的意思)
options(stringsAsFactors = T)
a <data.frame(case=paste0("S",1:9),values=runif(9))
plot(a$case,a$values)
--這種方法有個(gè)缺點(diǎn):數(shù)據(jù)框名a在代碼中重復(fù)出現(xiàn)(不符合懶惰(哦不右遭,高效)的要求)
這里地?cái)?shù)據(jù)框名比較簡(jiǎn)短冀痕,可能你看不出不夠優(yōu)雅荔睹,本著花花懶惰的強(qiáng)迫癥精神,不能允許數(shù)據(jù)框名出現(xiàn)兩次言蛇。(如果你不夠懶惰僻他,下面的代碼別看了,會(huì)瞎的)
那么如何懶惰地實(shí)現(xiàn):
方法1:attach
將數(shù)據(jù)框名添加到搜索環(huán)境中:attach(a),作圖時(shí)就只需輸入列名(連$都不用了)腊尚。
attach(a)
plot(case,values)
做完后將a刪除出搜索環(huán)境 detach(a)
局限性:兩個(gè)以上數(shù)據(jù)框的列名有沖突時(shí)吨拗,同時(shí)attach會(huì)報(bào)錯(cuò)。
方法2:with
with(a,{
plot(case,values)
x<<-summary(values) #求和并賦值給x,<<的意思是作為全局變量婿斥,也就是出了大括號(hào)仍有效劝篷。
})
x #運(yùn)行完后打印x
# Min. 1st Qu. Median Mean 3rd Qu. Max.
#0.1549 0.3953 0.4948 0.6050 0.9820 0.9895
簡(jiǎn)單查一下什么是with哦?這并不是一個(gè)必學(xué)的知識(shí)點(diǎn)民宿,只是作為補(bǔ)充娇妓。
由于昨天沒有用到腳本窗口,這里正好學(xué)習(xí)一下腳本的使用和保存:將上面的代碼復(fù)制(手打更好)到一個(gè)新的R腳本中活鹰。
然后保存到工作目錄下哈恰,用凡人的方式打開,你會(huì)看到它長(zhǎng)這樣志群。
請(qǐng)注意腳本文件的后綴就是R着绷,在R語言里還是很在意后綴的。很多復(fù)雜的代碼都是大神寫的锌云,就是以腳本的形式給你荠医,要用的時(shí)候直接找到他,用Rstudio打開就好桑涎。
作業(yè):整理筆記和思維導(dǎo)圖彬向,仍然發(fā)到簡(jiǎn)書專題,記得群里@花花攻冷,告知作業(yè)完成幢泼。
另外請(qǐng)?jiān)谧鳂I(yè)中回答一個(gè)問題:save(X,file="test.RData")這句代碼如果報(bào)錯(cuò)object X not found,是為什么讲衫,應(yīng)該怎么解決缕棵?
因?yàn)閄是一個(gè)變量,保存時(shí)不能保存變量涉兽,假如改稱d就可以直接保存