一雹舀、cars包中的Salaries數(shù)據(jù)集
1.查看原數(shù)據(jù)結(jié)構(gòu)
library(ggplot2)
library(car)
head(Salaries)
原數(shù)據(jù)前六行
其中rank為學(xué)術(shù)等級绎狭,sex為性別,yrs.since.phd為獲得博士學(xué)位的年數(shù),yrs.service為工齡竞穷,salary為9個月的薪水。
2.查看薪水如何隨學(xué)術(shù)等級變化
ggplot(Salaries,aes(x=salary,fill=rank))+geom_density()
數(shù)據(jù)有重疊系吩,調(diào)整透明度
ggplot(Salaries,aes(x=salary,fill=rank))+geom_density(alpha=.3)
3.查看博士學(xué)位畢業(yè)年數(shù)與薪水關(guān)系
ggplot(Salaries,aes(x=yrs.since.phd,y=salary,color=rank,shape=sex))+geom_point()
修改為刻面圖
ggplot(Salaries,aes(x=yrs.since.phd,y=salary,color=rank,shape=sex))+geom_point()+facet_grid(.~sex)
暫時忽略性別和學(xué)術(shù)等級来庭,做非參數(shù)光滑曲線loess,即默認(rèn)值smooth
ggplot(Salaries,aes(x=yrs.since.phd,y=salary))+geom_point()+geom_smooth()
顯示不是線性的關(guān)系穿挨,則按性別擬合一個二次多項式回歸
ggplot(Salaries,aes(x=yrs.since.phd,y=salary,linetype=sex,shape=sex,color=sex))+geom_point(size=2)+geom_smooth(method=lm,formula = y~poly(x,2),se=FALSE,size=1)
得出男性從0-30增加然后下降月弛,女性一直上升,數(shù)據(jù)集中沒有女性獲得博士學(xué)位超過40年科盛,男性大部分可以拿到很高的薪水帽衙。