參考 生信星球 公眾號教程
- 向量
- 從向量中提取元素
- 數據框
1.向量
c( ) 你可以理解為combine 把幾個元素合一起
向量:多個元素組成的變量
a<- c(6,8,8)
a<- c('wo','帥氣', '1')
標量:一個元素組成的變量
b<-'帥氣'
b<-'2'
x<-c(1,2,3) #常用的向量定義寫法疙教,意為將x定義為由元素1簸呈,2听怕,3組成的向量悼沈。
x<-(1:8) #1到8 : 1 2 3 4 5 6 7 8
x<-seq(1,6,by = 2) #1到6,間隔是2 : 1 3 5
x<-rep(1:2,times=2) #1到2重復2次 : 1 2 1 2
你賦值的變量 都在Rstudio右上角看得到
右上角
2. 從向量中提取元素
(1)根據元素位置
x<-c(1:10) # 先讓賦值給x ,10個元素
#這里的x是你剛才賦值的變量名睛约,根據自己的情況來修改
x[4] # x第4個元素
x[-4] # 排除法结蟋,除了第4個元素之外剩余的元素
x[2:4] # 第2到4個元素
x[-(2:4)] # 除了……
x[c(1,5)] # 第1個和第5個元素
(2)根據值的大小
x<-c(-1,0,1,2,10) #先給x個賦值
x[x==10] # 返回等于10的元素
x[x<0] # 返回<0的元素
x[x %in% c(1,2,5)] # 存在于向量c(1妥粟,2,5)中的元素
3. 數據框
(1)讀取本地數據
在公眾號【生信星球】后臺回復:“數據類型”即可獲得 示例數據
讀取要記得 設置你文件所在的目錄
setwd('C:\\Users\\XFY\\Desktop\\生信\\豆花分享') #設置工作目錄
read.table(file = "huahua.txt",sep = "\t",header =T) #讀取文件窝趣,分隔符為Tab蔗喂,有表頭
a<-read.table(file = "huahua.txt",sep = "\t",header =T)#把這個數據框賦給一個變量a
NA表示空值
點擊Rstudio右上角 數據框 a 顯示此界面
(2)設置行名和列名
1.讀取csv文件,查看行列名
#在示例數據里有doudou.txt 注意這里的變量X是一個數據框
X<-read.csv('doudou.txt')
colnames(X) #查看列名
rownames(X) #查看行名,默認值的行名就是行號高帖,1.2.3.4...
讀取csv文件缰儿,查看行列名
(3)修改行名 、列名
# 將 【列名】 第一個修改為 ‘bioplanet’
colnames(X)[1]<-"bioplanet"
# 修改 行名散址, 改第二行
rownames(X)[2]<-'試一試'
(4) 讀取csv時 row.names=F 或T 感受一下
#最后row.names的意思是修改第一列為行名
X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1)
row.names=T 時
(5)數據框的導出
導出txt格式:
分隔符是逗號 sep = ","
引號不要 quote=F
#分隔符改為逗號乖阵,字符串不加雙引號(默認格式帶由雙引號)
write.table(X,file = "yu.txt",sep = ",",quote=F)
(6)變量的保存與重新加載
學會保存和重新加載
有的數據是代碼運行很久得到的,可以保存预麸,下次直接調用
保存的格式是RData瞪浸。
save.image(file="bioinfoplanet.RData") # 保存當前所有變量
save(a,file="自己命名.RData") # 保存其中一個變量
load("自己命名.RData") # 再次使用RData時的加載命令
(7)提取元素
x [x,y] 逗號左邊x代表行,逗號右邊代表列
X[1, 2 ] # 第1行第2列
X[2,] # 第2行
X[ , 3] # 第3列
X[ 3] # 也是第3列
X[2:4] # 第2列到第4列
X[ ,2:4]
X[c(6,8)] # 第6列和第8列
X$ 列名 # 也可以提取列 美元符號$ 提取