- 對(duì)象:指可以賦值給變量的任何事物(常量、函數(shù)、圖形等)
- 模式(數(shù)據(jù)類型):對(duì)象的模式描述了此對(duì)象是如何存儲(chǔ)的——數(shù)值型、字符型故河、邏輯型復(fù)數(shù)型和原生型
數(shù)據(jù)的輸入
R提供了適用范圍廣泛的數(shù)據(jù)導(dǎo)入工具
使用鍵盤輸入數(shù)據(jù)
edit()函數(shù)會(huì)自動(dòng)調(diào)用一個(gè)允許手動(dòng)輸入數(shù)據(jù)的文本編輯器,步驟:
1吆豹、創(chuàng)建一個(gè)空的數(shù)據(jù)框/矩陣
2忧勿、針對(duì)這個(gè)數(shù)據(jù)對(duì)象杉女,調(diào)用文本編輯器
mydata=data.frame(age=numeric(0),gender=character(0),weight=numeric(0))
mydata=edit(mydata)
從帶分隔符的文本文件導(dǎo)入數(shù)據(jù)
read.table()函數(shù):mydataframe=read.table(file,options)
重要的option
header 第一行是否包含了變量名,邏輯變量
seq 設(shè)定數(shù)組的分隔符鸳吸。可以通過(guò)seq=" "進(jìn)行設(shè)定
na.strings 可選的用于表示缺失值的字符向量速勇,na.strings=c("-9","?")在讀取數(shù)據(jù)的時(shí)候轉(zhuǎn)換成NA
skip 讀取數(shù)據(jù)前跳過(guò)行的數(shù)目
read.table()在讀取時(shí)晌砾,會(huì)默認(rèn)把字符變量轉(zhuǎn)化為因子,可以通過(guò)colClasses選項(xiàng)對(duì)每一列指定一個(gè)列烦磁,或者設(shè)置stringsAsFactors=FALSE進(jìn)行更改
導(dǎo)入Excel數(shù)據(jù)
可以先將excel表輸出為逗號(hào)分隔文件在养匈,再用read.table進(jìn)行讀取。
也可以用xlsx包直接導(dǎo)入Excel工作表
最簡(jiǎn)單格式:read.xlsx(file,n) n為要導(dǎo)入的工作表序號(hào)1
其他可以導(dǎo)入的數(shù)據(jù)
XML:XML包
直接從網(wǎng)頁(yè)抓取數(shù)據(jù)
SPSS數(shù)據(jù):foreign包中的read.spss()都伪,Hmisc包中的spss.get()
SAS數(shù)據(jù)
...........