在前面的練習(xí)中杖虾,我們使用qplot練習(xí)作圖条辟,作為ggplot2的快速入門弹渔。然而胳施,qplot的局限性在于它只能使用一個(gè)數(shù)據(jù)集和一組圖形屬性映射,當(dāng)我們要進(jìn)行復(fù)雜數(shù)據(jù)的統(tǒng)計(jì)分析時(shí)肢专,qplot就不夠用了舞肆。解決這一問題的方法就是使用圖層,每一個(gè)圖層可以有屬于自己的數(shù)據(jù)集和圖形屬性映射博杖,附加的數(shù)據(jù)元素可以通過圖層添加到圖形中椿胯。
創(chuàng)建繪圖對(duì)象
當(dāng)我們調(diào)用qplot()時(shí),它其實(shí)為我們做了許多幕后工作:
- 創(chuàng)建一個(gè)圖形對(duì)象
- 添加圖層并展示結(jié)果
如果想手動(dòng)創(chuàng)建圖形對(duì)象剃根,就要使用ggplot()函數(shù)哩盲。該函數(shù)有兩個(gè)主要的參數(shù):數(shù)據(jù)和圖形屬性映射。
數(shù)據(jù):指定繪圖所使用的默認(rèn)數(shù)據(jù)集(必須是數(shù)據(jù)框)
映射:將圖形屬性和變量名放在函數(shù)aes()的括號(hào)中即可創(chuàng)建映射
比如狈醉,通過下面的代碼廉油,即可創(chuàng)建一組默認(rèn)映射:
#x為carat,y為price苗傅,colour為cut
p <- ggplot(diamonds, aes(carat, price, colour = cut))
不過抒线,上面的圖形對(duì)象在加上圖層之前是無法顯示的。
圖層
創(chuàng)建好繪圖對(duì)象后渣慕,我們可以使用+來添加圖層:
p + geom_point()
再通過添加圖層而添加幾何對(duì)象時(shí)嘶炭,我們需要注意:每一個(gè)幾何對(duì)象都對(duì)應(yīng)著一個(gè)默認(rèn)的統(tǒng)計(jì)變換和位置參數(shù)抱慌,而每一個(gè)統(tǒng)計(jì)變換都對(duì)應(yīng)著一個(gè)默認(rèn)的幾何對(duì)象參數(shù)。所以對(duì)于一個(gè)圖層旱物,我們只需要設(shè)定stat或geom參數(shù)即可遥缕。
數(shù)據(jù)
- ggplot2要求數(shù)據(jù)集必須是一個(gè)數(shù)據(jù)框(data frame)
- ggplot2會(huì)從我們給定的數(shù)據(jù)框中提取繪圖所需的變量,并生成一個(gè)新的數(shù)據(jù)集宵呛,而不是直接在原數(shù)據(jù)上進(jìn)行數(shù)據(jù)變換
- 使用ggplot2作圖時(shí)单匣,數(shù)據(jù)是以副本二不是引用的形式存儲(chǔ)在圖形對(duì)象中的,這樣可以使我們:
- 1.即使數(shù)據(jù)改變了宝穗,繪圖不會(huì)改變
- 2.ggplot2的對(duì)象都是自含型的户秤,所以它可以被存儲(chǔ)到磁盤上,并可被直接加載(load())運(yùn)行
圖形屬性映射
aes()函數(shù)用來將數(shù)據(jù)變量映射到圖形中逮矛,從而使變量成為可以被感知的圖形屬性鸡号。
aes()函數(shù)中有一系列的圖形屬性參數(shù):
#創(chuàng)建映射
aes(x = weight, y = height, colour = age)
#x,y可以省略须鼎,直接輸入映射值
aes(weight, height, colour = age)
幾何對(duì)象
幾何對(duì)象鲸伴,簡稱為geom,它執(zhí)行著圖層的實(shí)際渲染晋控,控制著生成的圖像類型汞窗。
- 每一個(gè)幾何對(duì)象都有一組它能識(shí)別的圖形屬性和一組繪圖所需的值。
- 每一個(gè)幾何對(duì)象都有一個(gè)默認(rèn)的統(tǒng)計(jì)變換赡译,并且每一個(gè)統(tǒng)計(jì)變換都有一個(gè)默認(rèn)的幾何對(duì)象仲吏。
統(tǒng)計(jì)變換
統(tǒng)計(jì)變換。簡稱為stat蝌焚,即對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)變換裹唆,它通常以某種方式對(duì)數(shù)據(jù)信息進(jìn)行匯總。
- 統(tǒng)計(jì)變換可將輸入的數(shù)據(jù)集看做輸入只洒,將返回的數(shù)據(jù)集作為輸出许帐,因此統(tǒng)計(jì)變換可向元數(shù)據(jù)集中插入新的變量。例如用來繪制直方圖的stat_bin統(tǒng)計(jì)變量會(huì)生成如下的變量:
- count:每個(gè)組里觀測值得數(shù)目毕谴;
- density:每個(gè)組里觀測值的密度(占整體的百分?jǐn)?shù)/組寬)
- x:組的中心位置
- 這些生成變量可被直接調(diào)用成畦,調(diào)用生成變量時(shí),必須使用..將其名字圍起來析珊,以和原數(shù)據(jù)集中的變量區(qū)分
比如:
ggplot(diamonds, aes(carat)) + geom_histogram(aes(y = ..density..), binwidth = 0.1)
位置調(diào)整
位置調(diào)整:是對(duì)圖層中的元素位置進(jìn)行微調(diào)。位置調(diào)整一般多見于處理離散型數(shù)據(jù)蔑穴,連續(xù)型數(shù)據(jù)一般很少出現(xiàn)完全重疊的問題忠寻。
常用的位置調(diào)整參數(shù)見下圖:
整合
一旦熟悉了圖層操作,就可以把本章所介紹的各種圖層功能結(jié)合起來存和,輕松做出復(fù)雜的圖形奕剃。
結(jié)合幾何對(duì)象和統(tǒng)計(jì)變換
將幾何對(duì)象和不同的統(tǒng)計(jì)變換進(jìn)行組合衷旅,可以輕松做出新穎的圖形。下面纵朋,我們基于相同的直方圖的統(tǒng)計(jì)變換柿顶,使用不同的幾何對(duì)象,以不同的形式來展示結(jié)果:面積操软、點(diǎn)和瓦塊圖嘁锯。
# 創(chuàng)建繪圖對(duì)象
d <- ggplot(diamonds, aes(carat)) + xlim(0,3)
# 對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)變換,并繪制面積圖層
d + stat_bin(aes(ymax = ..count..), binwidth =0.1 , geom ="area")
# 對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)變換聂薪,并繪制點(diǎn)圖圖層
d + stat_bin(aes(size = ..density..), binwidth = 0.1, geom = "point"
, position = "identity")
# 對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)變換家乘,并繪制瓦塊圖圖層
d + stat_bin2d(aes(y = 1, fill = ..count..), binwidth = 0.1, geom = "tile", position = "identity")
繪制面積圖圖層:
繪制點(diǎn)圖圖層:
繪制瓦塊圖圖層: