R數(shù)據(jù)可視化3: 直方/條形圖

什么是直方/條形圖锦亦?

直方圖(Histograms)和條形圖(Barchart)看起來沒有什么區(qū)別马绝,長得很像择示,但是這兩個并不同一種統(tǒng)計圖像束凑。具體地,通常直方圖用來描述連續(xù)型數(shù)據(jù)栅盲,比如年齡汪诉、身高、體重等谈秫。而條形圖通常用來描述分類型數(shù)據(jù)扒寄,比如性別、國家等拟烫。
對于直方圖该编,我們要做的第一步就是把連續(xù)性的數(shù)據(jù)分箱(bin),所謂的分箱實際上就是將數(shù)據(jù)按照一定的間隔進行分組硕淑。比如我們現(xiàn)在手上有100個人的年齡的數(shù)據(jù)课竣,從20歲到60歲,然后我們以10歲為間隔置媳,分別統(tǒng)計20-30于樟、30-40、40-50拇囊、50-60歲這四組的人數(shù)隔披,再進行繪圖。因此不同組之間通常是連續(xù)的寂拆,且間隔一致奢米。數(shù)據(jù)的連續(xù)性體現(xiàn)在圖像上就是柱子之間并沒有間隔抓韩。因此,直方圖可以粗略地表示出數(shù)據(jù)分布密度鬓长,被用于密度估計谒拴。

直方圖例子

而條形圖如下列例子統(tǒng)計了不同國家的樣本數(shù)量∩娌ǎ可以看到下圖的柱子之間有間隔英上,體現(xiàn)出國家并非一個連續(xù)變量而是一個分類變量。

條形圖例子

直方圖/條形圖怎么畫啤覆?

ggplot2提供了繪制直方圖和條形圖的功能苍日,分別為geom_bar()geom_histogram()。具體如下:

geom_histogram(mapping = NULL, data = NULL, stat = "bin",
    position = "stack", ...)
geom_bar(mapping = NULL, data = NULL, stat = "count",
  position = "stack", ...,)

那么這兩個函數(shù)是否有區(qū)別嗎窗声?實際上并沒有太大的區(qū)別相恃,geom_histogram()等同于geom_bar()+stat_bin()

進一步那么我們來研究如何繪制直方圖/條形圖笨觅。

1)需要什么格式的數(shù)據(jù)
本次我們來看一個新的R提供的數(shù)據(jù)拦耐,就是閃閃發(fā)光的鉆石??Diamonds。

數(shù)據(jù)集Diamonds

price:鉆石的價格见剩,單位美元
carat:鉆石的重量杀糯,單位克拉
cut:鉆石切割的質(zhì)量水平,F(xiàn)air, Good, Very Good, Premium, Ideal
color:鉆石的顏色苍苞,從J(最差)到D(最好)
clarity:鉆石的凈度固翰,I1(最差)SI2, SI1, VS2, VS1, VVS2, VVS1, IF (最好)
x:長度,單位mm
y:寬度羹呵,單位mm
z:深度骂际,單位mm
我們探討兩個問題——統(tǒng)計表中所有的鉆石(大約 50,000個)的重量分布以及凈度。
可以看到重量是一個連續(xù)型變量担巩,而凈度是一個分類型變量方援。所以前者我們做直方圖没炒,后者我們做條形圖涛癌。

2)如何使用ggplot2做直方圖

首先我們來看看鉆石重量的直方圖。

#加載包
library(ggplot2)
#作圖
ggplot(diamonds, aes(carat)) +
  geom_histogram()

輸入上述命令后我們會得到一條提示stat_bin() using “bins = 30”. Pick better value with “binwidth”.什么意思呢送火?就是把所有的數(shù)據(jù)按照相同間隔分成了30組拳话,圖上有30個柱子。(如圖)

從圖上我們可以看到大部分的鉆石都是1克拉以下种吸,較少的鉆石是2克拉以上弃衍。
那用geom_bar()會怎么樣呢?我們來看一看坚俗。

ggplot(diamonds, aes(carat)) +
  geom_bar()

可以看到如果使用上述命令镜盯,每一個重量對應的都有一個柱子岸裙,顯示了不同重量而非某個范圍的重量所對應的鉆石數(shù)量。剛剛我們說了geom_bar()+stat_bin()才是等同于geom_histogram()速缆。所以我們來看一下如果命令變成下述是怎么樣的降允?

ggplot(diamonds, aes(carat)) +
  geom_bar(stat='bin')

看,就和剛才一模一樣了艺糜!

3)如何使用ggplot2做條形圖
然后我們來瞧瞧條形圖剧董。

#加載包
library(ggplot2)
#作圖
ggplot(diamonds, aes(clarity)) +
  geom_bar()

從圖中我們可以看到不同等級凈度的鉆石情況。

4)如何做好看的直方/條形圖

利用下述代碼我們可以得到不同重量的鉆石切割水平的情況破停。

ggplot(diamonds, aes(carat,fill=cut)) +
  geom_histogram(bins = 20,color='black')+#分為20個組翅楼,添加邊框
  theme_bw()+
  theme(
    panel.grid = element_blank()#去除背景的分割線
  )+
  scale_fill_manual(values=brewer.pal(5,'Blues'))

利用下述代碼我們可以得到橫向的條形圖。

ggplot(diamonds, aes(clarity,fill=clarity)) +
  geom_bar()+
  theme_bw()+
  theme(
    panel.grid = element_blank()
  )+
  coord_flip()#轉(zhuǎn)為橫向

關(guān)于直方/條形圖的介紹就到這里啦真慢。大家還可以更進一步的看一看這兩個繪圖函數(shù)的功能毅臊,讓圖像變得更好看。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末晤碘,一起剝皮案震驚了整個濱河市褂微,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌园爷,老刑警劉巖宠蚂,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異童社,居然都是意外死亡求厕,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進店門扰楼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來呀癣,“玉大人,你說我怎么就攤上這事弦赖∠罾福” “怎么了?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵蹬竖,是天一觀的道長沼沈。 經(jīng)常有香客問我,道長币厕,這世上最難降的妖魔是什么列另? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮旦装,結(jié)果婚禮上页衙,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好店乐,可當我...
    茶點故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布艰躺。 她就那樣靜靜地躺著,像睡著了一般眨八。 火紅的嫁衣襯著肌膚如雪描滔。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天踪古,我揣著相機與錄音含长,去河邊找鬼。 笑死伏穆,一個胖子當著我的面吹牛拘泞,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播枕扫,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼陪腌,長吁一口氣:“原來是場噩夢啊……” “哼互订!你這毒婦竟也來了匪补?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤对室,失蹤者是張志新(化名)和其女友劉穎参滴,沒想到半個月后强岸,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡砾赔,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年蝌箍,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片暴心。...
    茶點故事閱讀 40,137評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡妓盲,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出专普,到底是詐尸還是另有隱情悯衬,我是刑警寧澤,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布檀夹,位于F島的核電站筋粗,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏击胜。R本人自食惡果不足惜亏狰,卻給世界環(huán)境...
    茶點故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一役纹、第九天 我趴在偏房一處隱蔽的房頂上張望偶摔。 院中可真熱鬧,春花似錦促脉、人聲如沸辰斋。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽宫仗。三九已至够挂,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間藕夫,已是汗流浹背孽糖。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留毅贮,地道東北人办悟。 一個月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像滩褥,于是被迫代替她去往敵國和親病蛉。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,086評論 2 355

推薦閱讀更多精彩內(nèi)容