1從文件中獲取
我們通常會從文件中導(dǎo)入數(shù)據(jù),文件類型可以是文本文件,也可以使excel表格。我個(gè)人認(rèn)為,最 常 用、最 好 用 的 是.csv 文 件。.csv叫做逗號分隔文件殿漠,什么是逗號分隔?:
比如 :test.csv
年齡 佩捞, 身高 绞幌,工資
20??? ,178?? 一忱,2000
40??? 莲蜘,158?? ,200000
這個(gè)就是逗號分隔掀潮。你可以在excel里菇夸,另存為.csv文件。那有了.csv文件仪吧,怎么導(dǎo)入呢庄新?可以使用read.table()函數(shù)。
test<-read.table("test.csv",header=TRUE,seq=",")
其中,第一個(gè)是文件位置择诈,第二個(gè)為true的化械蹋,它會把首行導(dǎo)進(jìn)來,就是
年齡 羞芍, 身高 哗戈,工資,分隔符號就是','號荷科。 ? 這個(gè)文件的內(nèi)容就會被導(dǎo)入到唯咬,test數(shù)據(jù)框中。另外需要注意的是畏浆,工作空間胆胰,當(dāng)文件在當(dāng)前工作空間時(shí),可以這樣寫刻获,不再工作空間蜀涨,文件位置可以寫絕對地址。另外可以使用
getwd()
setwd()
獲取當(dāng)前目錄蝎毡,或者設(shè)置當(dāng)前目錄厚柳。
2從數(shù)據(jù)庫中導(dǎo)入
這個(gè)有兩種方法:基于RODBC,利用各個(gè)數(shù)據(jù)庫所對應(yīng)的ODBC數(shù)據(jù)來導(dǎo)入相應(yīng)數(shù)據(jù)庫下面的表里面的信息沐兵。;基于R語言對于每個(gè)數(shù)據(jù)庫所提供的接口來獲取表里面的信息别垮,例如與MySQL數(shù)據(jù)庫對應(yīng)的RMySQL包。
這里使用第二種
> #1 加載RMySQL包??
>? ? library(RMySQL)? ?
> #2 建立連接??
>? ? con <-dbConnect(MySQL(), user="root", password = "root", host = "localhost", dbname="student")? ?
> #3 導(dǎo)入名為score表的信息? ?
>? mydataframe <-dbReadTable(conn = con, name = "score")