R讀取Excel、R與本機(jī)文件
以下內(nèi)容是我在R語言學(xué)習(xí)過程中的每一課的重點(diǎn)筆記記錄乌昔。
16??R語言讀入本機(jī)文件
1.每類文件都會(huì)使用對(duì)應(yīng)的分隔符隙疚,例如用逗號(hào)分隔的文件為.csv文件,讀取方式為:x ?<-? read.table(“data.csv”)或使用絕對(duì)路徑C:/Users/……
2.head(x)?? tail(x)? 顯示x對(duì)象首尾6行的內(nèi)容(默認(rèn)為6行)
head(x,n=10),一次顯示10行內(nèi)容
3.read.table()函數(shù)在使用時(shí)磕道,若是.csv文件應(yīng)設(shè)置sep=”,”供屉,所以應(yīng)提前知道文件的分隔符是什么,此函數(shù)中有以下參數(shù):
① header設(shè)置第一行是否跳過溺蕉,默認(rèn)為FALSE
② skip表示跳過某些內(nèi)容伶丐,如開頭的注釋
(例如設(shè)置skip=5,表示跳過前5行的信息)
③ nrows=100,控制讀取到第100行,而skip表示從哪里開始讀
④ na.strings表示哪些內(nèi)容是缺失值
⑤ stingsAsFactors 控制讀入的字符串是否轉(zhuǎn)化為因子疯特,默認(rèn)為TRUE
4.read.csv/csv2/delim/delim2? 適合特定格式的文件哗魂,delim的分隔符為制表符
5.read.fwf()讀取特定寬度的文件
read.fwf(“fwf.txt”,widths=c(3,3)),即給出每一列的寬度值
17? ?R語言讀入網(wǎng)絡(luò)文件
1.read.table(https://codeload......,header=TRUE)
此為網(wǎng)絡(luò)文本文件的具體位置,而并非網(wǎng)頁文件
2.讀取網(wǎng)絡(luò)表格文件:
①安裝與加載包:install.packages(“XML”) 漓雅;library(XML)
②查看包文檔:?readHTMLTable,里面的which參數(shù)指選取網(wǎng)頁的哪個(gè)表格录别,但注意盡量不要用R文件處理網(wǎng)頁文件
3.讀取任何其他格式文件都可先轉(zhuǎn)換為csv或txt文件朽色,而后read.table()即可
4.help(package=”foreign”)可以查看很多的read函數(shù)
5.讀取剪貼板內(nèi)容:
read.table(“clipboard”,header=T,sep=”,”)或者直接readClipboard()
6.讀取不規(guī)則格式的文件:
readLines(“….”,n=5)按照行讀取文件
scan()
18? ?讀寫Excel文件
1. 最簡單的方法:將Excel文件存儲(chǔ)為csv格式,之后在R中read.csv()即可组题,即:x <- read.csv(“文件名.csv”,header=TRUE)葫男,或是命令:read.table(“clipBoard”,seq=”,”,header=TRUE)
2.readClipboard(): 讀取剪貼板的內(nèi)容
3.使用XLConnect包讀取Excel文件,但計(jì)算機(jī)必須配置JAVA的運(yùn)行環(huán)境往踢,此分為一步法與兩步法:
① 兩步法:首先讀取工作簿腾誉,即整個(gè)Excel文件(workbook)
(1) library(XLConnect)
(2) x<-loadWorkbook(“data.xlsx”)
(3) readWorksheet(x,1)?? 1,代表讀取第一個(gè)工作表,2代表第二個(gè)峻呕,讀取后直接保存為數(shù)據(jù)框利职;其還有startRow, startCol, endRow, endCol,header參數(shù)
② 一步法:readWorksheetFromFile(“文件名”)
4.使用XLConnect包讀取R文件,此分為四步法與一步法:
① 四步法:
(1)創(chuàng)建工作簿:x ?<-loadWorkbook(‘file.xlsx”,create=T)
(2) 創(chuàng)建工作表:createSheet (x, ”Sheet1”)
(3)數(shù)據(jù)保存:
writeWorksheet(x,data=mtcars,sheet=”Sheet1”)
(4) 將工作簿存儲(chǔ)為Excel文件:
? ? ? ? ? ? ? ? ? ? ?saveWorkbook(x)
②一步法:
writeWorksheetToFile(“file.xlsx”, data=iris, sheet=“Sheet 1”) ;其還有startRow, startCol, endRow, endCol瘦癌,header參數(shù)
此包還有對(duì)電子表格函數(shù)處理等功能猪贪,更多內(nèi)容可查看包文檔,vignette(“XLConnect”)
5. 利用xlsx包讀取
library(xlsx)
read.xlsx(“data.xlsx”,1,startRow=1,endRow=100)
寫入時(shí):
write.xlsx(x,file=”a.xlsx”,sheetName=”Sheet 1”,append=F)(設(shè)定是否追加寫入)
19? ?讀寫R格式文件
1.R本身提供了兩種存儲(chǔ)文件的格式:.RDS(存儲(chǔ)單個(gè)R對(duì)象)與.Rdata(保存多個(gè)R對(duì)象)
2.以iris數(shù)據(jù)集為例,存儲(chǔ)RDS文件:
saveRDS(iris,file=”iris.RDS”)
x? <- ?readRDS(“iris.RDS”)
3.load(“.Rdata”)加載Rdata文件讯私,此在現(xiàn)有文件的基礎(chǔ)上直接加載热押,之前的變量并不會(huì)消失,所以盡量在右上角進(jìn)行查看當(dāng)前的變量變化情況
4.save(iris,iris3,file=”iris.Rdata”)保存Rdata文件
5.save.image()可保存當(dāng)前所有對(duì)象
歡迎關(guān)注我的個(gè)人微信公眾號(hào):全哥的學(xué)習(xí)生涯斤寇,里面分享的是關(guān)于自己醫(yī)學(xué)專業(yè)上的學(xué)習(xí)經(jīng)驗(yàn)桶癣,與本專業(yè)之外包括日語、英語以及數(shù)據(jù)分析中的重點(diǎn)知識(shí)匯總娘锁、學(xué)習(xí)方法與心得牙寞,當(dāng)然,還有我自己的保研歷程與經(jīng)驗(yàn)莫秆、一些生活上的感悟等等