文件讀寫
認(rèn)識csv格式
- 查看(windows查看-勾選文件擴(kuò)展名)
- 打開方式一:默認(rèn)excel
- 打開方式二:記事本(windows)/文本編輯(mac)
- 打開方式三:sublime(大文件)
- 打開方式四:R語言讀取-數(shù)據(jù)框
認(rèn)識分隔符
逗號(,)
空格( )
制表符(\t)
CSV = Comma Separated Values
TSV = Tab Separated Values
后綴名沒有意義,只是人為定義的格式后綴鼻弧,約定俗成。在電腦上可以更好的綁定打開該文件類型的軟件卤唉。(mac上顯示簡介里修改)
本質(zhì)都是純文本
讀取表格文件成為數(shù)據(jù)框
read.csv() -通常讀取CSV格式
read.table() -通常讀取txt格式
*讀取失敗一厌杜,文件不在工作目錄下(補(bǔ)充路徑)
*讀取失敗二榕栏,文件拼寫錯誤(用tab自動補(bǔ)齊)
*讀取失敗時堪滨,可能需要添加參數(shù)
write.csv(test,file = “excample.csv”) -test為要導(dǎo)出的數(shù)據(jù)框變量名/excample.csv為導(dǎo)出文件名
*最好不要覆蓋原文件胯陋,便于重復(fù)
Rdata
R特有數(shù)據(jù)存儲格式,無法用其他軟件打開
save(test袱箱,file = "example.Rdata") #保存變量test
save.image(file = "example.RData") #保存當(dāng)前envir所有變量
load("example.Rdata") #加載
#文件后綴名不重要遏乔,但是只能用load讀取
腳本(.R)、
數(shù)據(jù)(.Rdata)
表格(.txt或.csv)
工作目錄下無命名的.Rdata/.history可不管
ex常用參數(shù)
ex2 <- read.csv("ex2.csv",
header = T,#列名发笔,read.csv該項默認(rèn)T
comment.char = "!",#不讀取文件中盟萨!后的注釋信息
#存在注釋信息不寫參數(shù)會報錯,默認(rèn)為空不讀取
row.names = 1, #第1列作為行名
check.names = F #不自動修改列名等
)
高階數(shù)據(jù)讀取指南http://www.reibang.com/p/4ea320c0dcc6
R可讀取格式
其他可用R包
fread() : 智能讀取大文件
哈佛生信大佬:https://github.com/crazyhottommy/getting-started-with-genomics-tools-and-resources#crispr-related
Google插件推薦:https://www.scholarscope.cn/