“csv”文檔
csv可用excel,記事本(用逗號分隔)打開,還可以用軟件sublime打開璃吧。
R語言讀取生成數(shù)據(jù)框,對數(shù)據(jù)框的修改不會影響原文件
電腦上文件只有兩種:文本废境;非文本畜挨。-----曾健明
分隔符
常見:逗號,空格彬坏,制表符(\t)
R語言讀取文件
read.csv() # 只讀csv
reda.table() # 可以讀txt朦促、tsv
write.csv(test,file+"test.csv") #將test數(shù)據(jù)框生成csv文件
write.table() #同上
Rdata
R語言特有數(shù)據(jù)儲存格式,保存的是變量栓始,不是表格文件务冕,不涉及賦值。
save(test,x,y,file="example.Rdata")#將test,x,y三個變量存為Rdata幻赚。
load("example.Rdata")
###Rproject的組織形式
腳本.R禀忆,數(shù)據(jù).Rdata,表格.txt或.csv
小練習
#1.讀取ex1.txt落恼,善用Tab鍵補齊
EX1 <- read.table("ex1.txt",header = T) #第1行是列名箩退,就增加header=T
#2.讀取ex2_B cell receptor signaling pathway.csv
ex2 <- read.csv("ex2_B cell receptor signaling pathway.csv",row.names = 1,check.names = F) #第1列是行名,用row.names=1佳谦,列名特殊字符被改為.分隔戴涝,用check.names=F恢復。
#3.讀取GSE32575_series_matrix.txt钻蔑,賦值給gse啥刻。
gse <- read.table("GSE32575_series_matrix.txt",comment.char = "!",row.names = 1,header = 1)#發(fā)現(xiàn)報錯,用sublime打開一看這個文件有很多“!”的行咪笑,用comment.char="!"后就不會報錯可帽。
#4.描述gse的屬性
str(gse)
dim(gse)
colnames(gse)
rownames(gse)
class(gse)
#5.將gse導出為新的txt和csv文件。
write.csv(gse,"z.csv")
write.table(gse,"z.txt")
#6.將gse保存為Rdata并加載窗怒。
save(gse,ex2,file = "z.Rdata")
又一個小練習
#1.讀取complete_set.txt(已保存在工作目錄)
ex3 <- read.table("complete_set.txt",header = T)
# 2.查看有多少行映跟、多少列
str(ex3)
# 3.獲取行名和列名
rownames(ex3)
colnames(ex3)
# 4.導出為csv格式
write.csv(ex3,"ex3.csv")
# 5.保存為Rdata
save(ex3,file = "ex3.Rdata")
# 6.加載class.Rdata,查看數(shù)據(jù)類型
load("class.Rdata")
高階數(shù)據(jù)讀取指南http://www.reibang.com/p/4ea320c0dcc6
R語言能讀取的格式:fasta蓄拣、fastq等,可以搜一下努隙。
進階
小潔老師的好物推薦已保存在幕布球恤。
吉米老師的囑咐
生信基石之R語言
B站的10個小時教學視頻務必看完,參考 GitHub 倉庫存放的相關學習路線指導資料:https://github.com/jmzeng1314/R_bilibili 剃法,可以參考一些優(yōu)秀筆記碎捺,比如https://mubu.com/doc/2KUiSCfVsg
初級10 個題目:http://www.bio-info-trainee.com/3793.html
中級要求是:http://www.bio-info-trainee.com/3750.html
高級要求是完成20題: http://www.bio-info-trainee.com/3415.html
統(tǒng)計專題 30題:http://www.bio-info-trainee.com/4385.html
可視化專題30題:http://www.bio-info-trainee.com/4387.html
R語言學習的知識點路線圖及全部的學習規(guī)劃見:https://mp.weixin.qq.com/s/xOT4QGQsBMwu6R38AE9Y6A
了解常量和變量概念
加減乘除等運算(計算器)
多種數(shù)據(jù)類型(數(shù)值,字符贷洲,邏輯收厨,因子)
多種數(shù)據(jù)結構(向量,矩陣优构,數(shù)組诵叁,數(shù)據(jù)框,列表)
文件讀取和寫出
簡單統(tǒng)計可視化
無限量函數(shù)學習
建議大家多看各式各樣的R學習資料钦椭,總有一個能促動到你拧额!
有任何關于課程反饋,發(fā)郵件給我彪腔,我的郵箱地址是 jmzeng1314@163.com