mpg數(shù)據(jù)集的內(nèi)容
1.manufacturer:生產(chǎn)商 15個(gè)
2.model:型號(hào) 38個(gè)
3.displ:引擎排量-L 35個(gè)且蓬,單位為升欣硼,小數(shù)
4.year:出廠年份
5.cly:汽缸數(shù) 4,5,6,8
6.trans:變速方式:10個(gè)
7.drv:驅(qū)動(dòng)方式 f r 4
8.cty :每加侖汽油能跑的公里數(shù)(城市)21個(gè),整數(shù)
9.hwy:燃油效率:每加侖汽油能跑的公里數(shù)(高速路)單位英里/加侖恶阴,燃油效率高說(shuō)明省油诈胜。 27個(gè),整數(shù)冯事。
10.fl:燃油類型焦匈,五個(gè) p r e d c
11.class:車型 七個(gè) compact midsize suv 2seater minivan pickup subcompact
一,基礎(chǔ)作圖:在ggplot2中昵仅,圖是采用串聯(lián)起來(lái)( +)號(hào)函數(shù)創(chuàng)建的缓熟。每個(gè)函數(shù)修改屬于自己的部分。
如:ggplot(data = mpg,aes(x = displ, y = hwy)) + geom_point()
. 調(diào)節(jié)顏色和大兴ん浴:
-
ggplot(data = mpg,aes(x = displ, y = hwy, color = class)) + geom_point()
按照七個(gè)車型畫出不同顏色的點(diǎn)image.png -
ggplot(data = mpg,aes(x = displ, y = hwy, size = class)) + geom_point()
按照七種車型畫出不同大小的點(diǎn)image.png
3.透明度和形狀:參數(shù)alpha = class和shape = class
二荚虚,添加分面
1.依據(jù)單個(gè)變量分面 facet_wrap()
ggplot(data = mpg,aes(x = displ, y = hwy)) + geom_point() + facet_wrap(~ class, nrow = 2)
#分兩行展示
注意~分面依據(jù)必須是離散型變量。
2.依據(jù)兩個(gè)變量分面 facet_grid()
ggplot(data = mpg,aes(x = displ, y = hwy)) + geom_point() + facet_grid(drv ~ cyl)
3.不想在行或列維度中分面籍茧,用.代替變量名
ggplot(data = mpg, aes(x = displ, y = hwy)) + geom_point() + facet_grid(. ~ cyl)
就等于ggplot(data = mpg, aes(x = displ, y = hwy)) + geom_point() + facet_wrap( ~ cyl,nrow = 1)
三版述、分組
將一個(gè)圖形屬性映射為一個(gè)離散型變量,ggplot2就會(huì)自動(dòng)對(duì)數(shù)據(jù)進(jìn)行分組來(lái)繪制多個(gè)幾何對(duì)象寞冯。這種形式是隱式分組渴析,不需要添加圖例和區(qū)分特征。
如:將線性映射為drv(驅(qū)動(dòng)方式吮龄,d,f,4)就會(huì)自動(dòng)變成三條線型不同的線俭茧。
四母债、同一張圖顯示多個(gè)幾何對(duì)象--局部映射和全局映射
這里涉及到圖層啦。
局部映射-映射只對(duì)改圖層有效
有多個(gè)幾何對(duì)象時(shí)尝抖,映射語(yǔ)句要重復(fù)多次毡们,又丑又麻煩。
(幾何對(duì)象也就是圖的不同類型昧辽,如點(diǎn)圖衙熔、折線圖、直方圖等)
ggplot(data = mpg) + geom_point(mapping = aes(x = displ, y = hwy)) + geom_smooth(mapping = aes(x = displ, y = hwy))
全局映射--對(duì)所有圖層生效
ggplot(data = mpg, mapping = aes(x = displ, y = hwy)) + geom_point() + geom_smooth()
局部映射與全局映射沖突時(shí)搅荞,服從局部映射红氯。
例如:
library(dplyr)
#filter函數(shù)出自dplyr包
ggplot(data = mpg, mapping = aes(x = displ, y = hwy)) + geom_point(mapping = aes(color = class)) + geom_smooth(data = filter(mpg, class == "subcompact"), se = FALSE)
#se是standard error的縮寫框咙,se參數(shù)為擬合曲線添加標(biāo)準(zhǔn)誤差帶,也就是那個(gè)灰不啦嘰的灰色背景帶痢甘,默認(rèn)是TRUE喇嘱。