學(xué)習(xí)R語(yǔ)言
1.注意事項(xiàng):
(1)R的賦值符號(hào)不是等號(hào)冤灾,而是<-
(2)在Console 控制臺(tái)輸入命令,相當(dāng)于Linux的命令行
(3)R的代碼都是帶括號(hào)的沫浆,括號(hào)必須是英文的警绩。
(4)顯示工作路徑 getwd()
(5)向量是由元素組成的,元素可以是數(shù)字或者字符串玻褪。
(6)表格在R語(yǔ)言中改名叫數(shù)據(jù)框_
(7)別只復(fù)制代碼肉渴,要理解其中的命令、函數(shù)的意思带射。函數(shù)或者命令不會(huì)用時(shí)同规,除了百度/谷歌搜索以外,用這個(gè)命令查看幫助:?read.table
窟社,調(diào)出對(duì)應(yīng)的幫助文檔券勺,翻到example部分研究一下。
(8)數(shù)據(jù)類型:向量灿里,數(shù)據(jù)框
2.標(biāo)量和向量的區(qū)分
首先明確“元素”的意思关炼,元素指的是數(shù)字或者字符串(用chr表示)等,根據(jù)它可以區(qū)分兩個(gè)詞:
標(biāo)量:一個(gè)元素組成的變量
向量:多個(gè)元素組成的變量
賦值:使用時(shí)匣吊,一般都會(huì)直接給變量定義儒拂,也就是“賦值”寸潦,字面意思是賦予這個(gè)變量一個(gè)數(shù)值(其實(shí)也不一定是數(shù)值,還可以是字符串/數(shù)據(jù)框等等)社痛。
第一次賦值被第二次的覆蓋了见转,第二次的賦值又被第三次的覆蓋了,以此類推蒜哀,以最后一次為準(zhǔn)哦斩箫。
3.從向量中提取元素
(1)根據(jù)元素位置
#這里的x是你剛才賦值的變量名,根據(jù)自己的情況來(lái)修改
x[4] #x第4個(gè)元素
x[-4]#排除法撵儿,除了第4個(gè)元素之外剩余的元素
x[2:4]#第2到4個(gè)元素
x[-(2:4)]#除了第2-4個(gè)元素
x[c(1,5)] #第1個(gè)和第5個(gè)元素
(2)根據(jù)值
x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1乘客,2,5)中的元素
4.數(shù)據(jù)框:將示例數(shù)據(jù)放在你的工作目錄下(5硇R缀恕!重要)
(1)讀取本地?cái)?shù)據(jù)
(2)設(shè)置行名和列名
X<-read.csv('doudou.txt') #在示例數(shù)據(jù)里有doudou.txt 注意這里的變量X是一個(gè)數(shù)據(jù)框
colnames(X) #查看列名
rownames(X) #查看行名,默認(rèn)值的行名就是行號(hào)房匆,1.2.3.4...
colnames(X)[1]<-"bioplanet"#有的公司返回?cái)?shù)據(jù)耸成,左上角第一格為空,R會(huì)自動(dòng)補(bǔ)為x,用這個(gè)命令來(lái)修改
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#最后row.names的意思是修改第一列為行名
(3)數(shù)據(jù)框的導(dǎo)出
write.table(X,file = "yu.txt",sep = ",",quote=F)#分隔符改為逗號(hào)浴鸿,字符串不加雙引號(hào)(默認(rèn)格式帶由雙引號(hào))
(4)變量的保存與重新加載
#這次沒(méi)有處理完的數(shù)據(jù)下次想接著用怎么辦?--學(xué)會(huì)保存和重新加載井氢。保存的格式是RData。
save.image(file="bioinfoplanet.RData")#保存當(dāng)前所有變量
save(X,file="test.RData")#保存其中一個(gè)變量
load("test.RData")#再次使用RData時(shí)的加載命令
(5)提取元素
- X[x,y]#第x行第y列
- X[x,]#第x行
- X[,y]#第y列
- X[y] #也是第y列
- X[a:b]#第a列到第b列
- X[c(a,b)]#第a列和第b列
- X$列名#也可以提取列(優(yōu)秀寫法岳链,而且這個(gè)命令還優(yōu)秀到不用寫括號(hào)的地步花竞,并且支持Tab自動(dòng)補(bǔ)全哦,不過(guò)只能提取一列)