圖形屬性
x
y
xmin
xmax
ymin
ymax
xend
yend
weight
color:輪廓色
fill:填充色
shape:點形狀
linetype: dotted dashed
size:點大小容诬,線條大小(粗細)
alpha:透明度,0-1:完全透明-完全不透明
width:寬度(條形圖等)
binwidth:組距(直方圖等)
label:名稱(如x瞬痘,y,legend等)
angle:角度
hjust:水平平移
vjust:垂直平移
lower
middle
upper
map_id
group:分組
position:位置調(diào)整
點圖
ggplot(data=mpg,aes(x=displ,y=hwy))+
geom_point(color='grey')#輪廓色為灰色(實質(zhì)效果:填充部分也為灰色)
ggplot(data=mpg,aes(x=displ,y=hwy))+
geom_point(fill='blue')#點圖無填充色選項验毡,所以等于空設(shè)置升熊;而color默認(rèn)黑色
ggplot(data=mpg,aes(x=displ,y=hwy))+
geom_point(aes(color=cyl),alpha=I(0.6)) #設(shè)置透明度,alpha范圍是0到1虚青,全透明到不透明菱涤;I()表示設(shè)定苞也,跟映射函數(shù)aes()相對
ggplot(data=mpg,aes(x=displ,y=hwy))+
geom_point(aes(color=factor(cyl)),alpha=0.6) #cyl為整數(shù),系統(tǒng)識別#默認(rèn)是連續(xù)變量粘秆,所以生成的圖例是連續(xù)型顏色圖例如迟;factor使之因子化
ggplot(data=mpg,aes(x=displ,y=hwy))+
geom_point(aes(color=factor(cyl),shape=factor(cyl)),alpha=0.6)
將cyl映射至形狀屬性
折線圖
ggplot(data=mpg,aes(x=displ,y=hwy))+
geom_line(color='grey',size=2)
條形圖
ggplot(data=mpg,aes(x=factor(displ),y=hwy))+
geom_bar(stat='identity',width=0.8,color='green',fill='grey')
stat是指統(tǒng)計變換;#stat='identity'是指不進行統(tǒng)計變換即hwy就是縱
坐標(biāo)值因為displ出現(xiàn)眾多的重復(fù)值,所以分組更多殷勘,縱坐標(biāo)值不斷累加
width為組距此再,color為輪廓色(可以看到y(tǒng)值累加上去),fill為填充色
ggplot(data=mpg,aes(x=displ))+
geom_bar(stat='density')
統(tǒng)計變換為密度即y為displ的密度分布玲销;注意输拇,這里不需要給y映射變量
統(tǒng)計變換為bin,中文翻譯是bin封箱,其過程是生成變量count(對x計數(shù))贤斜,density(一維密度估計)淳附,x(組的中心估計)——默認(rèn)利用count和x;如若#要引用這幾個變量蠢古,則在變量左右加雙圓點,譬如 ..density..
?
直方圖:
僅限于x為連續(xù)型變量别凹,如果x為離散型則該函數(shù)報錯——此時可以利用條線圖來繪制直方圖
ggplot(data=mpg,aes(x=displ,fill=fl))+
geom_histogram(binwidth=0.2草讶,position=”stack”)
binwidth 為The width of the bins;不同于條形圖的width
position是指位置調(diào)整炉菲,stack是堆疊即同組幾何對象堆疊
?ggplot(data=mpg,aes(x=displ,fill=fl))+
geom_histogram(binwidth=0.4,position='dodge')
position是指位置調(diào)整堕战,dodge是同組幾何對象并列
位置調(diào)整的參數(shù)還有:fill jitter identity
箱線圖:
ggplot(data=mpg,aes(x=factor(fl),y=hwy))+
geom_boxplot(color='grey')
ggplot(data=mpg,aes(x=1,y=hwy))+
geom_boxplot(fill='grey',color='blue') #hwy不分組
ggplot(data=mpg,aes(x=1,y=hwy))+
geom_boxplot(fill='grey',color='blue',outlier.colour= "red", outlier.shape = 1) #高亮異常值并賦予特定的幾何對象
曲線密度圖
使用geom_density
ggplot(data=mpg,aes(x=displ,fill=fl))+geom_density(color='white',size=0.1,alpha=I(0.3))
ggplot(data=mpg,aes(x=displ,y=..density..))+geom_histogram(fill='grey',binwidth=0.18,alpha=I(0.3))+geom_density(color='white',size=0.8)
幾乎看不到密度曲線拍霜。原因:直方圖和密度圖結(jié)合在一起嘱丢。直方圖中bin變換生成y變量有count和density,默認(rèn)使用前者祠饺,這樣由于count很大越驻,density很小(總是小于1),就會值得密度線處于低位道偷,難以看到缀旁,所以需要y=..density..(引用bin變換的數(shù)據(jù)必須前后加雙圓點)
?
ggplot(data=mpg,aes(x=displ))+geom_histogram(fill='grey',binwidth=0.18,alpha=I(0.3))+geom_density(color='white',size=0.8)
???
餅圖
ggplot(data=mpg,aes(x=1,fill=fl))+geom_bar()+
coord_polar(theta='y')
?coord_polar是極坐標(biāo)的意思,區(qū)別以往的笛卡爾坐標(biāo)勺鸦。coord_polar()作用是把把笛卡爾坐標(biāo)變換為極坐標(biāo)并巍。該函數(shù)有theta,start,direction三個參數(shù),后者者頂多是圖的微調(diào)换途,需要了解可以查看幫助文件懊渡,theta才是關(guān)鍵。極坐標(biāo)參數(shù)theta有兩個指標(biāo)半徑和角度军拟,就餅圖而言剃执,各部分內(nèi)容的角度不同,半徑相同吻谋;而默認(rèn)theta=”x”,即將x映射為角度忠蝗,剩下的y映射為半徑。這些為前期準(zhǔn)備漓拾,下面一步步分解這個過程阁最。
First step: 生成條形圖戒祠,其中各部分的比例關(guān)系用y反映。
ggplot(data=mpg,aes(x=1,fill=fl))+geom_bar()
?
second step: 將坐標(biāo)極坐標(biāo)化速种,y映射為角度(此時x恒等于1,即半徑相同)
ggplot(data=mpg,aes(x=1,fill=fl))+geom_bar()+
coord_polar(theta='y')
ggplot(data=mpg,aes(x=1,fill=fl))+geom_bar()+
coord_polar(theta=”x”)
如果x映射為角度姜盈,則y映射為半徑,生成眼圖
?