小白貼士:
- R的賦值符號(hào)不是等號(hào),而是<-
- 在Console 控制臺(tái)輸入命令蹬竖,相當(dāng)于Linux的命令行
- R的代碼都是帶括號(hào)的,括號(hào)必須是英文的
- 顯示工作路徑
getwd()
- 函數(shù)或者命令不會(huì)用時(shí),除了百度/谷歌搜索以外恶守,用這個(gè)命令查看幫助:
?read.table
埋嵌,調(diào)出對(duì)應(yīng)的幫助文檔破加,翻到example部分研究一下。 - 表格在R語(yǔ)言中改名叫數(shù)據(jù)框
數(shù)據(jù)類型里雹嗦,生信學(xué)習(xí)者最需要熟悉的是向量和數(shù)據(jù)框范舀。
向量
1. 標(biāo)量和向量的區(qū)分
- 向量是由元素組成的,元素可以是數(shù)字或者字符串(用chr表示)
-
標(biāo)量:一個(gè)元素組成的變量
向量:多個(gè)元素組成的變量
2. 使用
- 字符串在使用時(shí)需加引號(hào)
- 使用時(shí)了罪,一般都會(huì)直接給變量定義锭环,也就是“賦值”,字面意思是賦予這個(gè)變量一個(gè)數(shù)值(其實(shí)也不一定是數(shù)值泊藕,還可以是字符串/數(shù)據(jù)框等等)辅辩。
> x<- c(1,2,3) #常用的向量寫(xiě)法,意為將x定義為由元素1娃圆,2玫锋,3組成的向量。
x
x<- 1:10 #從1-10之間所有的整數(shù)
x
x<- seq(1,10,by = 0.5) #1-10之間每隔0.5取一個(gè)數(shù)(注意是逗號(hào)不是分號(hào))
x
x<- rep(1:3,times=2) #1-3 重復(fù)2次
x
#多次給x賦值讼呢,以最新的為準(zhǔn)
例如:創(chuàng)建一個(gè)數(shù)據(jù)框
age <- c(25,34,28,52) #給變量age賦值
diabetes <- c("Type1", "Type2", "Type1", "Type1")
status <- c("Poor","Improved","Excellent","Poor")
patientID <- c(1,2,3,4)
patientdata <- data.frame(patientID, age, diabetes, status) #patientdata為該數(shù)據(jù)框名稱撩鹿,向量按順序排列
注:
- 單擊右上角的Data,可查看表格悦屏∪担或者在控制臺(tái)輸入
view(數(shù)據(jù)框名稱)
- 每一列必須有列名吧寺,每一行也可指定行名,如果不指定行名散劫,就是從1開(kāi)始自增的順序數(shù)標(biāo)識(shí)稚机。
colnames(X) #查看列名
rownames(X) #查看行名,默認(rèn)值的行名就是行號(hào)获搏,1.2.3.4...
后期更改列名:names(patientdata) <- c("wei","hei","gen")
更改行名:row.names(patientdata) <- c("Mary","Alice","Bob","Judy")赖条,按順序排列
3.從向量中提取元素
(1)根據(jù)元素位置
x[4] #x第4個(gè)元素
x[-4]#排除法常熙,除了第4個(gè)元素之外剩余的元素
x[2:4]#第2到4個(gè)元素
x[-(2:4)]#除了第2-4個(gè)元素
x[c(1,5)] #第1個(gè)和第5個(gè)元素
(2)根據(jù)值
數(shù)據(jù)框
1. R讀取txt文件
(1)新建一個(gè)數(shù)據(jù)纬乍,示例:doudou.txt,需要把源數(shù)據(jù)文件復(fù)制一份放在工作目錄下裸卫,方便引用仿贬。
(2)使用R讀取txt文件直接使用read.table()
方法進(jìn)行讀取即可,不需要加載額外的包墓贿。
例如:read.table(file = "doudou.txt",sep= "\t",header = T)
注釋:
制表符:功能是在不使用表格的情況下在(垂直)方向按列對(duì)齊文本茧泪。
(3) 輸入X<-read.csv('doudou.txt')
,創(chuàng)建了一個(gè)名為X的數(shù)據(jù)框聋袋,引用的是doudou.txt的源數(shù)據(jù)
(4)數(shù)據(jù)框的導(dǎo)出
write.table(X,file = "yu.txt",sep = ",",quote=F)