#b站視頻——R語言入門與數(shù)據(jù)分析
#內(nèi)置數(shù)據(jù)集
#固定格式的數(shù)據(jù)(矩陣卿堂、數(shù)據(jù)框或一個時間序列等)
#統(tǒng)計建模栓票、回歸分析等試驗需要找合適的數(shù)據(jù)集
#R內(nèi)置數(shù)據(jù)集肴熏,存儲在饿这,通過
help(package="datasets")
#通過data函數(shù)訪問這些數(shù)據(jù)集
data()
#得到新窗口? 前面:數(shù)據(jù)集名字? 后面:內(nèi)容
#包含R所有用到的數(shù)據(jù)類型现横,包括:向量躬翁、矩陣蠢箩、列表挨决、因子、數(shù)據(jù)框以及時間序列等
#直接輸入數(shù)據(jù)集的名字就可以直接使用這些數(shù)據(jù)集
#輸出一個向量
rivers
#是北美141條河流長度
#這些數(shù)據(jù)集的名字都是內(nèi)置的弦讽,一般我們在給變量命名時最好不要重復(fù)
#否則數(shù)據(jù)集在當(dāng)前對話中會被置換掉
#例如
rivers<-c(1,2,3)
rivers
#不過影響不大
#再使用data函數(shù)重新加載這個數(shù)據(jù)集就可以了
data("rivers")
rivers
#一些常用內(nèi)置數(shù)據(jù)集
#默認(rèn)介紹頁面只有名字和介紹污尉,并沒有給出數(shù)據(jù)分類
#哪些是向量、矩陣往产、數(shù)據(jù)框等?
#查看數(shù)據(jù)集除了直接敲數(shù)據(jù)集名字顯示數(shù)據(jù)之外
#還可以使用help函數(shù)查看每個數(shù)據(jù)集具體的內(nèi)容
help("mtcars")
euro
#歐元匯率某宪,長度為11仿村,每個元素都有命名
#輸出向量的屬性信息
names(euro)
#將5個數(shù)據(jù)構(gòu)成一個數(shù)據(jù)框
向量
state.abb #美國50個州的雙字母縮寫
state.area #美國50個州的面積
state.name #美國50個州的全稱
因子
state.division #美國50個州的分類,9個類別
state.region #美國50個州的地理分類
#
state<-data.frame(state.name,state.abb,state.area,state.division,state.region)
state
state.x77 #美國50個州的八個指標(biāo)
state.x77
VADeaths #1940年弗吉尼亞州死亡率(每千人)
volcano #某火山區(qū)的地理信息(10米×10米的網(wǎng)格)
WorldPhones #8個區(qū)域在7個年份的電話總數(shù)
iris3 #3種鳶尾花形態(tài)數(shù)據(jù)
#以上矩陣→適合畫熱圖
heatmap(volcano)
#這里只是作為一個演示兴喂,還需要對這個圖進(jìn)行一些調(diào)整
#更復(fù)雜的數(shù)據(jù)結(jié)構(gòu)
Titanic #泰坦尼克乘員統(tǒng)計蔼囊,是一個數(shù)組
UCBAdmissions #伯克利分校1973年院系、錄取和性別的頻數(shù)
crimtab #3000個男性罪犯左手中指長度和身高關(guān)系
HairEyeColor #592人頭發(fā)顏色衣迷、眼睛顏色和性別的頻數(shù)
occupationalStatus #英國男性父子職業(yè)聯(lián)系
#類矩陣
eurodist #歐洲12個城市的距離矩陣畏鼓,只有下三角部分
Harman23.cor #305個女孩八個形態(tài)指標(biāo)的相關(guān)系數(shù)矩陣
Harman74.cor #145個兒童24個心理指標(biāo)的相關(guān)系數(shù)矩陣
#R中內(nèi)置最多的數(shù)據(jù)集——數(shù)據(jù)框
cars #1920年代汽車速度對剎車距離的影響
iris #3種鳶尾花形態(tài)數(shù)據(jù)
mtcars #32輛汽車在11個指標(biāo)上的數(shù)據(jù)
rock #48塊石頭的形態(tài)數(shù)據(jù)
sleep #兩藥物的催眠效果
swiss #瑞士生育率和社會經(jīng)濟(jì)指標(biāo)
trees #樹木形態(tài)指標(biāo)
USArrests #美國50個州的四個犯罪率指標(biāo)
women #15名女性的身高和體重
#列表
state.center #美國50個州中心的經(jīng)度和緯度
#類數(shù)據(jù)框
Orange #桔子樹生長數(shù)據(jù)
#時間序列數(shù)據(jù),和數(shù)據(jù)框類似壶谒,不同的是具有時間序列的順序云矫,是數(shù)據(jù)分析中非常常見的格式
#能反映出變化情況以及變化的趨勢等
#因此有很多專門的方法用于時間序列的數(shù)據(jù)分析
co2 #1959-1997年每月大氣co2濃度(ppm)
presidents #1945-1974年每季度美國總統(tǒng)支持率
uspop #1790–1970美國每十年一次的人口總數(shù)(百萬為單位)
#除了內(nèi)置數(shù)據(jù)集之外,許多R擴(kuò)展包中也內(nèi)置了很多數(shù)據(jù)集
#這些數(shù)據(jù)集作為擴(kuò)展包的函數(shù)使用的案例
#加載R包之后這些數(shù)據(jù)集也同樣被加載進(jìn)來
#例如MASS包中的Cars93數(shù)據(jù)
#包含了27個變量汗菜,是1993年93輛汽車的型號指標(biāo)
install.packages("MASS")
library("MASS")
help("Cars93")
#使用data函數(shù)在參數(shù)package中等于對應(yīng)R包的名字让禀,即可列出每個R包中包含的數(shù)據(jù)集
#ex
data(package="MASS")
#顯示R中所有可用的數(shù)據(jù)集
data(package=.packages(all.available = TRUE))
#不加載R包使用其中的數(shù)據(jù)集
data(Chile,package="car")
Chile
#> data(Chile,package="car")
#Warning message:
#? In data(Chile, package = "car") : data set ‘Chile’ not found
#> Chile
#Error: object 'Chile' not found
install.packages("car")
library("car")
help("Chile")