主題分析(一):企業(yè)人員流失分析

對于一個企業(yè)而言迟杂,最核心的資產(chǎn)應(yīng)該是人才,留住人才就能保持企業(yè)的持續(xù)發(fā)展本慕,但沒有員工流失的企業(yè)是不存在的排拷。實際情況是,無論企業(yè)的平臺多么高锅尘,福利多么好监氢,肯定還是會存在員工離職的情況,這是一種非常正常的現(xiàn)象藤违。對于企業(yè)而言浪腐,就需要識別員工離職的真正原因,提高人力資源管理中的短板顿乒,留住對企業(yè)真正有用的人才议街。(沒用的人就讓他走好了。璧榄。特漩。吧雹。)
  本文將從數(shù)據(jù)分析的角度來看真正影響員工的離職的原因。本文的數(shù)據(jù)來自kaggle網(wǎng)站涂身,可以去原始地址下載點我下載原始數(shù)據(jù)雄卷。如果沒有kaggle賬號的,可以點擊下面鏈接下載:
百度網(wǎng)盤下載蛤售, 密碼:PVxq

數(shù)據(jù)說明

壓縮包中有一個csv文件丁鹉,包含了企業(yè)14999個員工的評價信息和在職情況,包含的字段如下:

  • satisfaction_level: 員工滿意度:0-1之間的一個數(shù)值悍抑。得分越高代表員工對企業(yè)越滿意鳄炉。
  • last_evaluation: 最近一次評分:0-1之間的一個數(shù)值。得分越高代表員工表現(xiàn)越好搜骡。
  • number_project: 員工做過的總項目數(shù)拂盯。
  • average_montly_hours: 每月的平均工作時長(小時)。
  • time_spend_company: 員工在公司的時間(年)记靡。
  • Work_accident: 員工是否在職期間有過工傷谈竿。
  • left: 是否離職(0-在職,1-離職)摸吠。
  • promotion_last_5years: 最近5年是否有過升職(0-沒有空凸,1-有)。
  • sales: 部門寸痢。
  • salary: 薪水(low-低薪呀洲,medium-中等收入,high-高薪)啼止。

數(shù)據(jù)探索

本章我們使用R語言對企業(yè)員工數(shù)據(jù)進行探索道逗,目的是分析員工的離職究竟和哪些因素有關(guān)系。

載入需要的包

library(ggplot2)
library(corrplot)
library(rpart)
library(rpart.plot)
library(caret)
library(e1071)

讀入文件

df = read.csv(file="HR_comma_sep.csv", header = T, sep = ',')
head(df)
數(shù)據(jù)內(nèi)容

探索數(shù)據(jù)的結(jié)構(gòu)

str(df)
數(shù)據(jù)結(jié)構(gòu)
summary(df)
數(shù)據(jù)概況

計算各個維度之間的相關(guān)性

#由于sales和salary為factor献烦,所以先去掉
hr_col = df[,c(1:8)]
hr_col_matrix = cor(hr_col)
corrplot(hr_col_matrix)

畫出各個變量的相關(guān)性如下:

相關(guān)性分析

因為left=1表示員工已經(jīng)離職滓窍,從上述途中和left相關(guān)的變量可以看出:

  • 員工滿意度越高,員工越不會離職
  • 員工受過工傷巩那,越不會離職 (這個原因...)
  • 最近5年有過升職的員工吏夯,離職的可能性比較低
  • 每月平均工作時間越長的員工,離職的可能性越高

下面我們通過箱體圖來進行對比分析單個元素對于員工是否離職的影響即横。

  • 員工滿意度
ggplot(data=hr_col, aes(x=as.factor(left), y=satisfaction_level))+geom_boxplot(aes(fill=as.factor(left)))
員工滿意度箱體圖

從上圖可以看出噪生,選擇留在公司的員工一般都是對公司比較 滿意的。

  • 員工評分
ggplot(data=hr_col, aes(x=as.factor(left), y=last_evaluationlast_evaluation))+geom_boxplot(aes(fill=as.factor(left)))
員工評分箱體圖

從上圖可以看出东囚,評分在0.6-0.8之間的員工比較穩(wěn)定杠园。

  • 做過的項目數(shù)量
ggplot(data=hr_col, aes(x=as.factor(left), y=number_project))+geom_boxplot(aes(fill=as.factor(left)))
員工項目數(shù)量箱體圖

從上圖可以看出,項目數(shù)量在3-4個左右的員工是比較穩(wěn)定的。

  • 月平均工作時間(小時)
ggplot(data=hr_col, aes(x=as.factor(left), y=average_montly_hours/8))+geom_boxplot(aes(fill=as.factor(left)))
月平均工作小時箱體圖

在上圖中抛蚁,我按照每天8小時工作時間陈醒,將小時換算成為天。從上圖可以看出瞧甩,每月工作時間在20到30天之間的員工比較穩(wěn)定钉跷。(我們也看到有工作時間在20天以下的,也跳槽了肚逸,這一般估計是缺勤的爷辙。另外有工作時間超過30天的,這種估計就是壓力特別大,所以離職也是可以理解的,去哪里工作不是工作對吧_

  • 員工工作年限
ggplot(data=hr_col, aes(x=as.factor(left), y=time_spend_company))+geom_boxplot(aes(fill=as.factor(left)))
員工工作年限箱體圖

從圖中可以看到于樟,工作年限2-4年的員工比較穩(wěn)定,當(dāng)然也看到有工作年限在8-10年的骨灰級員工血当,他們離職醫(yī)院是比較弱的。left=1的員工基本工作年限在3-5年禀忆,所以這個時間段應(yīng)該是員工離職的高發(fā)時間段臊旭。

  • 5年內(nèi)是否有過升職
df_pro = aggregate(df$left, by = list(df$promotion_last_5years),  FUN = sum)
colnames(df_pro) = c('promotion_last_5years', 'left_sum')
df_pro$promotion_last_5years=as.factor(df_pro$promotion_last_5years)
p=ggplot(data = df_pro, mapping = aes(x = '', y = left_sum, fill = promotion_last_5years)) + geom_bar(stat = 'identity', position = 'stack', width = 1)+coord_polar(theta = "y")
p+labs(x = '', y = '離職人員數(shù)量對比', title = '離職人員最近5年升職情況對比')
離職人員升職情況對比

我們篩選出所有離職的員工,然后統(tǒng)計其5年內(nèi)是否有過升職箩退。通過上圖可以看出离熏,占比超過99%的離職員工5年內(nèi)都沒有升過職。所以戴涝,企業(yè)對于員工的升職加薪對于留住員工還是很重要的滋戳。

  • 薪水情況
df_sal = aggregate(df$left, by = list(df$salary),  FUN = sum)
colnames(df_sal) = c("salary", 'left_sum')
p=ggplot(data = df_sal, mapping = aes(x = '', y = left_sum, fill = salary)) + geom_bar(stat = 'identity', position = 'stack', width = 1)+coord_polar(theta = "y")
p+labs(x = '', y = '離職人員數(shù)量對比', title = '離職人員薪酬情況對比')
薪水對于員工的影響

從上圖可以看出,離職員工中薪水較低和中等的占比超過了95%啥刻。結(jié)合之前的升職情況統(tǒng)計奸鸯,離職的原因很明了了。(沒有升職郑什、沒有加薪府喳,畫個餅就讓我一直給你打工....)

  • 部分離職對比
df_sales = aggregate(df$left, by = list(df$sales),  FUN = sum)
colnames(df_sales) = c("sales", 'left_sum')
label_value <- paste('(', round(df_sales$left_sum/sum(df_sales$left_sum) * 100, 1), '%)', sep = '')
label_value
label <- paste(df_sales$sales, label_value, sep = '')
p=ggplot(data = df_sales, mapping = aes(x = '', y = left_sum, fill = sales)) + geom_bar(stat = 'identity', position = 'stack', width = 1)+coord_polar(theta = "y")
p+labs(x = '', y = '離職人員數(shù)量對比', title = '離職人員部門情況對比')+scale_fill_discrete(labels=label)

部門對比

從上圖看出蒲肋,銷售和技術(shù)人員在離職人員中占比是最高的蘑拯。企業(yè)應(yīng)該特別注意這兩個部門的員工。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末兜粘,一起剝皮案震驚了整個濱河市申窘,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌孔轴,老刑警劉巖剃法,帶你破解...
    沈念sama閱讀 206,378評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異路鹰,居然都是意外死亡贷洲,警方通過查閱死者的電腦和手機收厨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來优构,“玉大人诵叁,你說我怎么就攤上這事∏胀郑” “怎么了拧额?”我有些...
    開封第一講書人閱讀 152,702評論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長彪腔。 經(jīng)常有香客問我侥锦,道長,這世上最難降的妖魔是什么德挣? 我笑而不...
    開封第一講書人閱讀 55,259評論 1 279
  • 正文 為了忘掉前任恭垦,我火速辦了婚禮,結(jié)果婚禮上盲厌,老公的妹妹穿的比我還像新娘署照。我一直安慰自己,他們只是感情好吗浩,可當(dāng)我...
    茶點故事閱讀 64,263評論 5 371
  • 文/花漫 我一把揭開白布建芙。 她就那樣靜靜地躺著,像睡著了一般懂扼。 火紅的嫁衣襯著肌膚如雪禁荸。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,036評論 1 285
  • 那天阀湿,我揣著相機與錄音赶熟,去河邊找鬼。 笑死陷嘴,一個胖子當(dāng)著我的面吹牛映砖,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播灾挨,決...
    沈念sama閱讀 38,349評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼邑退,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了劳澄?” 一聲冷哼從身側(cè)響起地技,我...
    開封第一講書人閱讀 36,979評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎秒拔,沒想到半個月后莫矗,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,469評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,938評論 2 323
  • 正文 我和宋清朗相戀三年作谚,在試婚紗的時候發(fā)現(xiàn)自己被綠了三娩。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,059評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡妹懒,死狀恐怖尽棕,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情彬伦,我是刑警寧澤滔悉,帶...
    沈念sama閱讀 33,703評論 4 323
  • 正文 年R本政府宣布,位于F島的核電站单绑,受9級特大地震影響回官,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜搂橙,卻給世界環(huán)境...
    茶點故事閱讀 39,257評論 3 307
  • 文/蒙蒙 一歉提、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧区转,春花似錦苔巨、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,262評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至蜻韭,卻和暖如春悼尾,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背肖方。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工闺魏, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人俯画。 一個月前我還...
    沈念sama閱讀 45,501評論 2 354
  • 正文 我出身青樓析桥,卻偏偏與公主長得像,于是被迫代替她去往敵國和親艰垂。 傳聞我的和親對象是個殘疾皇子泡仗,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,792評論 2 345

推薦閱讀更多精彩內(nèi)容