小白速記
星球.png
向量
向量.jpg
數(shù)據(jù)框
讀取本地?cái)?shù)據(jù)
1砍艾、首先你的工作目錄下要有要讀取的文本文件,可以是txt格式(字符間用分隔符隔開(kāi))平项,也可以是csv格式(字符間用逗號(hào)隔開(kāi))。
2、R代碼:
讀取文件.png
其中sep參數(shù)指定文件使用什么分隔符置蜀,默認(rèn)是空白分隔,如果是以逗號(hào)隔開(kāi)的csv文件悉盆,sep應(yīng)設(shè)置為","盾碗。
header參數(shù)是讀取文件的時(shí)候是否將第一行視為變量的名稱,而不是當(dāng)成具體的數(shù)值來(lái)處理舀瓢。如果讀取第一行為表頭名稱廷雅,此參數(shù)應(yīng)該設(shè)為header = TRUE,否則就是FALSE。
數(shù)據(jù)框X.png
3航缀、設(shè)置行名和列名
colnames(X) #查看列名
查看列名.png
rownames(X) #查看行名,默認(rèn)值的行名就是行號(hào)
查看行名.png
colnames(X)[1]<-"bioplanet"#將第一行的名稱定義為字符串bioplanet
更改列名.png
X<-read.csv(file = "huahua.txt",sep = ",",header =T,row.names=1)#最后row.names的意思是修改第一列為行名
修改行名.png
4商架、數(shù)據(jù)框的導(dǎo)出
write.table(X,file = "yu.txt",sep = ",",quote=F) #分隔符改為逗號(hào),字符串不加雙引號(hào)(默認(rèn)格式帶由雙引號(hào))
數(shù)據(jù)框?qū)С?png
5芥玉、變量的保存與重新加載
這次沒(méi)有處理完的數(shù)據(jù)下次想接著用怎么辦?--學(xué)會(huì)保存和重新加載蛇摸。保存的格式是RData。
save.image(file="bioinfoplanet.RData") #保存當(dāng)前所有變量
save(X,file="test.RData") #保存其中一個(gè)變量
load("test.RData") #再次使用RData時(shí)的加載命令
保存格式.png
6灿巧、提取元素
例如:
- X[x,y] #第x行第y列
- X[x,] #第x行
- X[,y] #第y列
- X[y] #也是第y列
- X[a:b] #第a列到第b列
- X[c(a,b)] #第a列和第b列
- X$列名 #提取列(優(yōu)秀寫法赶袄,不用寫括號(hào),支持Tab自動(dòng)補(bǔ)全抠藕,但只能提取一列)
數(shù)據(jù)框X.png
提取數(shù)據(jù)框X的X2列.png
作業(yè):
如果save(X,file="test.RData"),這句代碼如果報(bào)錯(cuò)object X not found饿肺。原因?