ggplot2:第五章-工具箱(一)

Date: 27th september 2019
-本章內(nèi)容較多,其相對(duì)較難邪乍,因此降狠,我們將會(huì)分為幾部分進(jìn)行記錄。

5.1 簡介(略)

5.2 圖層疊加的總體策略

圖層有三種用途
1)用以展示數(shù)據(jù)本身
2)用以展示數(shù)據(jù)的統(tǒng)計(jì)摘要
3)用以添加額外的元數(shù)據(jù)

5.3 基本圖形類型

geom_area() 用于繪制面積圖
geom_bar() 用于繪制條形圖
geom_line() 用于繪制線條圖
geom_point() 用于繪制散點(diǎn)圖
geom_polygon() 用于繪制多邊圖
geom_text() 可以指定點(diǎn)添加標(biāo)簽庇楞。他是唯一一個(gè)額外圖形屬性的:它需指定label參數(shù)榜配。可以通過設(shè)置可選的圖形屬性hjust和vjust來控制文本的橫縱位置吕晌。
geom_tile() 用來繪制色深圖(image plot)或水平圖(level plot)
繪制以上幾種幾何圖形

df <- data.frame(
  x = c(3,1,5),
  y = c(2,4,6),
  label = c("a", "b", "c")
)
p <- ggplot(df, aes(x,y)) + xlab(NULL) + ylab(NULL)
p + geom_point() + labs(title = "geom_point")  #散點(diǎn)圖
p + geom_bar(stat = "identity") + labs(title = "geom_bar(stat=\"identity\")") #直方圖
p + geom_line() + labs(title = "geom_line")  #線性圖
p + geom_area() + labs(title = "geom_area")  #面積
p + geom_path() + labs(title = "geom_path")  #路徑圖
p + geom_text(aes(label =label)) + labs(title = "geom_text")  #添加標(biāo)簽
p + geom_tile() + labs(title = "geom_tile") #深色圖
p + geom_polygon() + labs(title = "geom_polygon")  #多邊形
bar_map

line_map

5. 4 展示數(shù)據(jù)分布

改變組距寬度(binwidth)或顯示精確指定切分位置(breadks)
有多種方式可以用來進(jìn)行分布的跨組比較:同時(shí)繪制多個(gè)小的直方圖蛋褥,facets = . ~var;使用頻率多邊形(frequency polygon)睛驳,geom = "freqploly"烙心;或者使用條件密度圖, position = "fill"

depth_dist <- ggplot(diamonds, aes(depth)) + xlim(58,58)
depth_dist + geom_histogram(aes(y = ..densitiy..), binwidth = 0.1) + 
  facet_grid(cut ~.)

depth_dist +geom_histogram(aes(fill = cut ), binwidth = 0.1, position = "fill")
depth_dist + geom_freqpoly(aes(y = ..dendity.., colour = cut), 
                           binwidth = 0.1)

作為幾何對(duì)象的直方圖和頻率多邊形均使用stat_bin統(tǒng)計(jì)變換乏沸。次統(tǒng)計(jì)變換生成了兩個(gè)輸出變量count和density淫茵。變量count為默認(rèn)值

geom_boxplot = stat_boxplot +geom_boxplot #箱線圖,即一個(gè)連續(xù)型變量針對(duì)一個(gè)類別變量條件所得的圖形

箱線圖也可以對(duì)連續(xù)變量取條件蹬跃,前提是數(shù)據(jù)預(yù)先經(jīng)過巧妙的封箱(binning)處理

箱線圖

library(plyr)
qplot(cut, deoth, data = diamonds, geom = "boxplot")
qplot(carat, depth, data = diamonds, geom = "boxplot", 
      group = round_any(carat, 0.1,floor), xlim = c(0,3))
#圖解釋:對(duì)于連續(xù)型變量痘昌,必須設(shè)置group圖形屬性以得到多個(gè)箱線圖。此處使用了group = round_any(carat, 0.1, floor)
####來獲得針對(duì)變量carat以0,1單位為大小封箱后的箱線圖
boxplot

geom_jitter = position_jitter + geom_jitter :通過在離散型分布 上添加隨機(jī)噪聲以避免遮蓋繪制完問題,這是一種較為粗糙的方法辆苔。

qplot(class, cty, data = mpg, geom = "jitter")
qplot(class, drv, data = mpg, geom = "jitter")

geom_density = stat_density + geom_area ##基于核平滑方法進(jìn)行平滑后得到頻率多邊形算灸。 僅在已知潛在的密度分布為平滑、連續(xù)且無界的時(shí)候使用這種密度圖驻啤。

qplot(depth, data = diamonds, geom = "density", xlim = c(54, 70)) #變量depth的密度圖
qplot(depth, data = diamonds, geom = "density", xlim = c(54, 70),
      fill = cut, alpha = I(0.2))  #按照變量cut的不同取值上色

5.5 處理遮蓋繪制問題

散點(diǎn)圖是研究兩個(gè)連續(xù)型變量間關(guān)系的重要工具菲驴, 但是數(shù)據(jù)量很大時(shí),這些點(diǎn)出現(xiàn)重疊問題骑冗,從而掩蓋真實(shí)關(guān)系赊瞬,這種為為“遮蓋繪制(overplotting)”

#下圖所用數(shù)據(jù)從兩個(gè)獨(dú)立的正態(tài)分布中所得的2000個(gè)點(diǎn),
df <- data.frame(x = rnorm(2000), y = rnorm(2000))
nrom <- ggplot(df, aes(x, y))
norm + geom_point()
norm + geom_point(shaoe = 1)
norm + geom_point(shape = ".")
###使用"alpha"進(jìn)行透明度的設(shè)置
norm + geom_point(colour = "black", alpha = 1/3)

##數(shù)據(jù)離散性    設(shè)置兩個(gè)連續(xù)整數(shù)間距的一半(0.5)作為打散的寬度
td <- ggplot(diamonds, aes(table, depth)) + 
  xlim(50, 70) + ylim(50, 70)
td + geom_point()
td + geom_jitter()
td +geom_jitter(width = 0.5, alpha = 1/10) ##alpha 參數(shù)調(diào)節(jié)透明度
td + geom_jitter(position = jit)
td + geom_jitter(position = jit, colour = "black", alpha = 1/10)  #調(diào)節(jié)透明度
point_map

jitter_map

第五章的后半部分內(nèi)容將在一節(jié)進(jìn)行描述

ggplot2: 第二章 -全網(wǎng)最全的教程
ggplot2:第三章-語法突破
ggplot2:第四章-用圖層構(gòu)建圖像
ggplot2:第五章-工具箱(一)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末贼涩,一起剝皮案震驚了整個(gè)濱河市巧涧,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌遥倦,老刑警劉巖谤绳,帶你破解...
    沈念sama閱讀 216,651評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件劫扒,死亡現(xiàn)場(chǎng)離奇詭異累魔,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)锌仅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,468評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門堡称,熙熙樓的掌柜王于貴愁眉苦臉地迎上來瞎抛,“玉大人,你說我怎么就攤上這事却紧⊥╇” “怎么了?”我有些...
    開封第一講書人閱讀 162,931評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵晓殊,是天一觀的道長豪硅。 經(jīng)常有香客問我,道長挺物,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,218評(píng)論 1 292
  • 正文 為了忘掉前任飘弧,我火速辦了婚禮识藤,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘次伶。我一直安慰自己痴昧,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,234評(píng)論 6 388
  • 文/花漫 我一把揭開白布冠王。 她就那樣靜靜地躺著赶撰,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上豪娜,一...
    開封第一講書人閱讀 51,198評(píng)論 1 299
  • 那天餐胀,我揣著相機(jī)與錄音,去河邊找鬼瘤载。 笑死否灾,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的鸣奔。 我是一名探鬼主播墨技,決...
    沈念sama閱讀 40,084評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼挎狸!你這毒婦竟也來了扣汪?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,926評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤锨匆,失蹤者是張志新(化名)和其女友劉穎崭别,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體统刮,經(jīng)...
    沈念sama閱讀 45,341評(píng)論 1 311
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡紊遵,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,563評(píng)論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了侥蒙。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片暗膜。...
    茶點(diǎn)故事閱讀 39,731評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖鞭衩,靈堂內(nèi)的尸體忽然破棺而出学搜,到底是詐尸還是另有隱情,我是刑警寧澤论衍,帶...
    沈念sama閱讀 35,430評(píng)論 5 343
  • 正文 年R本政府宣布瑞佩,位于F島的核電站,受9級(jí)特大地震影響坯台,放射性物質(zhì)發(fā)生泄漏炬丸。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,036評(píng)論 3 326
  • 文/蒙蒙 一蜒蕾、第九天 我趴在偏房一處隱蔽的房頂上張望稠炬。 院中可真熱鬧,春花似錦咪啡、人聲如沸首启。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,676評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽毅桃。三九已至褒纲,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間钥飞,已是汗流浹背莺掠。 一陣腳步聲響...
    開封第一講書人閱讀 32,829評(píng)論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留代承,地道東北人汁蝶。 一個(gè)月前我還...
    沈念sama閱讀 47,743評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像论悴,于是被迫代替她去往敵國和親掖棉。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,629評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容