第五章 工具箱
5.1 簡介
本章列舉了ggplot2中大量幾乎對(duì)象和統(tǒng)計(jì)變換的一部分,并把它們按照用途進(jìn)行細(xì)分射富。
5.2 圖層疊加的總體策略
- 用以展示數(shù)據(jù)本身
- 用以展示數(shù)據(jù)的統(tǒng)計(jì)摘要
- 用以添加額外的元數(shù)據(jù)、上下文信息和注解
5.3 基本圖形類型
每種幾何對(duì)象自身即可獨(dú)立構(gòu)建圖形搓扯,同時(shí)也可以組合起來構(gòu)建更復(fù)雜的幾何對(duì)象。
這些和對(duì)象均是二維的,因此x和y兩種圖形屬性都是不可或缺的峰弹。同時(shí),它們都可以接受colour和size圖形屬性芜果,另外鞠呈,填充型幾何對(duì)象(條形、瓦片和多邊形)還可以接受fill圖形屬性师幕。點(diǎn)使用shape圖形屬性粟按,線和路徑接受linetype圖形屬性诬滩。
geom_area()
:面積圖`geom_bar(stat = "identity")``:條形圖,我們需要制定stat= "identity"灭将,因?yàn)槟J(rèn)的統(tǒng)計(jì)變換將自動(dòng)對(duì)值進(jìn)行技術(shù)疼鸟。而統(tǒng)計(jì)統(tǒng)計(jì)變換identity將保持?jǐn)?shù)據(jù)不變。
geom_line
:線條圖庙曙,group屬性決定了哪些觀測(cè)是連接在一起的空镜。geom_path與geom_line類似,但前者將數(shù)據(jù)點(diǎn)按出現(xiàn)的順序進(jìn)行連接捌朴,而非從左至右進(jìn)行連接吴攒。geom_point
:散點(diǎn)圖geom_polygon
:多邊形,既填充后的路徑砂蔽。數(shù)據(jù)中的每一行代表了多邊形的一個(gè)頂點(diǎn)geom_text
:在指定點(diǎn)處添加標(biāo)簽洼怔。它是,這些幾何對(duì)象中唯一一個(gè)需要額外圖形屬性的:它需要制定label參數(shù)左驾。我們可以通過設(shè)置可選的圖形屬性hjust和vjust來控制文本的橫縱位置镣隶;此外,可以設(shè)置圖形屬性angle來控制文本的旋轉(zhuǎn)诡右。geom_tile
:深圖(image plot)或水平圖(level plot)安岂。
5.4 展示數(shù)據(jù)分布
5.5 處理遮蓋繪制問題
散點(diǎn)圖是研究兩個(gè)連續(xù)型變量間關(guān)系的重要工具。但是當(dāng)數(shù)據(jù)量很大時(shí)帆吻,這些點(diǎn)經(jīng)常會(huì)出現(xiàn)重疊現(xiàn)象域那,從而掩蓋真實(shí)的關(guān)系。處理辦法:
- 小規(guī)模的遮蓋問題可以通過繪制更小的點(diǎn)(
shape = "."
猜煮,一像素大小的點(diǎn))加以緩解次员,或者使用中空的符號(hào)(shape = 1
) - 對(duì)于更大的數(shù)據(jù)集產(chǎn)生的更為嚴(yán)重的遮蓋問題,可以使用
alpha
(透明度)讓點(diǎn)呈現(xiàn)透明效果友瘤。假如以比值的形式制定alpha值翠肘,則分母表示一個(gè)位置的顏色變?yōu)橥耆煌该鲿r(shí)所需重疊的數(shù)量。在R中最小值為1/256
5.10 添加圖形注解
geom_text
:可添加文字?jǐn)⑹龌驗(yàn)辄c(diǎn)添加標(biāo)簽辫秧,往往用于對(duì)離群點(diǎn)或其他重要的點(diǎn)記性標(biāo)注geom_vline
,geom_hline
:像圖形添加垂直或水平線geom_abline
:添加任意斜率和截距的直線geom_rect
:向感興趣的區(qū)域添加矩形被丧,擁有xmin盟戏、xmax、ymin和ymax四個(gè)圖形屬性甥桂。geom_line
,geom_path
和``geom_segment`都可以添加直線柿究。所有這些幾何對(duì)象都有一個(gè)arrow參數(shù),可以用于在線上放置一個(gè)箭頭黄选。我們也可以使用arrow()函數(shù)繪制箭頭蝇摸,它擁有angle, length, ends以及type幾個(gè)參數(shù)婶肩。