? ? ? ? 每年三、四月份為各大企業(yè)招聘的旺季疫衩,此時的招聘網(wǎng)站上涌現(xiàn)了大量的招聘信息硅蹦,讓求職者目接不暇。現(xiàn)以智聯(lián)招聘網(wǎng)站為例隧土,獲取提针、整理、分析了廣東地區(qū)數(shù)據(jù)分析師的招聘信息曹傀,旨在為自己找工作時提供一些參考辐脖。
一、數(shù)據(jù)獲取
通過網(wǎng)絡(luò)爬蟲獲取數(shù)據(jù)
二皆愉、數(shù)據(jù)結(jié)構(gòu)
得到的數(shù)據(jù)共12個字段嗜价,其各自對應(yīng)的解釋如下:
ID:職位ID????????
city:工作地點
company:公司名稱
company_scale:公司規(guī)模
company_nature:公司性質(zhì)
industry_field:公司所處領(lǐng)域
title:職位名稱
job_desc:工作描述(全職或?qū)嵙?xí))
welfare:工作福利
experience:工作經(jīng)驗
education:學(xué)歷要求
salary:薪資
三、數(shù)據(jù)清洗
利用Excel對數(shù)據(jù)進行清理幕庐,步驟如下:
1久锥、去除重復(fù)值;
2异剥、刪除title字段為空的數(shù)據(jù)瑟由;
2、刪除job_desc字段為“實習(xí)”的數(shù)據(jù)冤寿;
3歹苦、篩選出title中包含“數(shù)據(jù)分析”青伤、“數(shù)據(jù)”、“分析師”的數(shù)據(jù)殴瘦;
4狠角、salary字段的默認格式為“XXXX—XXXX元/月”,現(xiàn)通過函數(shù)提取薪水下限與薪水上限蚪腋,再將兩者平均之后得到平均工資丰歌,記為新字段avg_salary;
最終得到1479條數(shù)據(jù)
四屉凯、數(shù)據(jù)分析
數(shù)據(jù)分析內(nèi)容的可視化利用Tableau完成
1立帖、哪些城市對數(shù)據(jù)分析師的需求大?
深圳和廣州作為廣東省內(nèi)的一線城市毫無疑問地成為了需求最多的城市神得,占據(jù)了百分之八十以上的需求厘惦,佛山、東莞這兩個二線城市也有一定的人才缺口哩簿,其它二三線城市對數(shù)據(jù)分析師的需求不大宵蕉。
2、哪些公司在招數(shù)據(jù)分析師节榜?
共計865家公司發(fā)出了1479個職位羡玛,平均每個公司發(fā)布1.7個職位,招聘崗位數(shù)量Top20公司如上圖所示宗苍。由公司名稱可以推測:互聯(lián)網(wǎng)稼稿、金融、數(shù)據(jù)公司讳窟、零售等相關(guān)行業(yè)對數(shù)據(jù)分析師需求較為巨大让歼。招聘崗位數(shù)目Top20公司
從詞云可以看到數(shù)據(jù)分析師需求廣泛分布于社會各個行業(yè)±龇龋互聯(lián)網(wǎng)/電子商務(wù)谋右、金融、零售及其相關(guān)行業(yè)這些最早重視數(shù)據(jù)补箍、利用數(shù)據(jù)的公司對數(shù)據(jù)分析師需求依然巨大改执,令人驚喜的是:房地產(chǎn)、電子坑雅、交通運輸辈挂、石油化工等傳統(tǒng)行業(yè)也慢慢重視起數(shù)據(jù)的力量,這對于有志于進入數(shù)據(jù)分析領(lǐng)域的人來說無疑是個好消息裹粤。
20人以下的公司招聘人數(shù)最少终蒂,這種規(guī)模較小的公司一般處于創(chuàng)業(yè)期,數(shù)據(jù)的積累量不大,對分析師的需求較少后豫。
3.招聘門檻如何悉尾?
擁有1-3年工作經(jīng)驗的人最受用人單位青睞,這些擁有一定經(jīng)驗的年輕人可以馬上上手新工作挫酿,降低了企業(yè)的用人成本。其次是不限工作經(jīng)歷愕难,但是這類招聘信息中貌似混入了很多疑似培訓(xùn)中介機構(gòu)類似的企業(yè)單位早龟,有意思的是大多與金融行業(yè)相關(guān),所以還請廣大應(yīng)聘者注意甄別招聘信息的真實信猫缭。較1-3年工作經(jīng)驗而言葱弟,3-5年工作經(jīng)驗需求減少很多,5-10年工作經(jīng)驗的需求就更少了猜丹,可能的原因有二:一是3年以上工作經(jīng)驗的人可能已成為公司中層芝加,更傾向于穩(wěn)定,跳槽遠沒有1-3年工作經(jīng)驗的人頻繁射窒,因此企業(yè)的缺口并不大藏杖;二是對于工作經(jīng)驗豐富的高級、資深數(shù)據(jù)分析師來說有更加專業(yè)的應(yīng)聘脉顿、跳槽渠道(獵頭推薦蝌麸、公司直接挖人)。無經(jīng)驗和1年以下工作經(jīng)驗的需求最少艾疟,因為此次爬取的數(shù)據(jù)聚焦于社會招聘来吩,傾向于招聘有經(jīng)驗的求職者。
可見數(shù)據(jù)分析師的學(xué)歷門檻不高蔽莱,大專及本科足矣滿足大部分崗位需求弟疆,只有小部分崗位要求碩士學(xué)歷。
那么盗冷,學(xué)歷要求與經(jīng)驗要求之間是否存在相關(guān)關(guān)系呢怠苔?經(jīng)卡方檢驗發(fā)現(xiàn)確實存在相關(guān)關(guān)系。觀察上圖也可知正塌,中專學(xué)歷需求少嘀略,同時對經(jīng)驗需求也不高;大專學(xué)歷中乓诽,1-3年工作經(jīng)驗需求多帜羊,對3年以上經(jīng)歷(3-5年和5-10年)的需求陡然減小鸠天;本科學(xué)歷中讼育,同樣是1-3年工作經(jīng)驗招聘崗位數(shù)最多,但3年以上工作經(jīng)驗的需求相比較大專學(xué)歷來說大大增加。也就是說奶段,雖然數(shù)據(jù)分析領(lǐng)域入行門檻不高饥瓷,若想走得更遠一些,本科學(xué)歷還是比較必要的痹籍。另外呢铆,不限學(xué)歷、不限工作工作經(jīng)驗這類信息是營銷廣告的重災(zāi)區(qū)蹲缠,這些套路聽起來是否有點似曾相識呢棺克?
4.薪資如何?
此部分主要探討了工作經(jīng)驗线定、學(xué)歷對薪水的影響娜谊。
薪資中位數(shù)隨著工作經(jīng)驗的增加而增加,且薪資組內(nèi)方差隨著工作經(jīng)驗的增加而增加斤讥,說明隨著工作經(jīng)驗的增加纱皆,組內(nèi)崗位性質(zhì)出現(xiàn)了分化:高度專業(yè)化的工作(如:高級數(shù)據(jù)分析師、數(shù)據(jù)主管)能獲得很高薪水芭商,而對能力要求不高的工作往往薪水較低派草。另一個有趣的現(xiàn)象是:不限工作經(jīng)驗組組內(nèi)方差也很大,也出現(xiàn)了高薪資的極端值蓉坎,通過查看這些極端值的原始數(shù)據(jù)澳眷,發(fā)現(xiàn)對應(yīng)聘者的要求還是非常高的,沒有相關(guān)工作經(jīng)驗是不可能應(yīng)聘上的蛉艾。
薪資中位數(shù)隨著學(xué)歷的升高而增加钳踊,當(dāng)然這里面也有工作經(jīng)驗的耦合影響。例如:中專學(xué)歷的中位數(shù)最小勿侯,組內(nèi)方差最小拓瞪,說明學(xué)歷天花板確實存在。大專學(xué)歷中有薪水很高的極端值出現(xiàn)助琐,說明天花板可以被突破祭埂。本科學(xué)歷中出現(xiàn)的極端值數(shù)目最多:一來與其頻數(shù)有關(guān),二來是因為3年以上工作經(jīng)驗的需求大大增加兵钮。碩士學(xué)歷中位數(shù)最高蛆橡,但極端值沒有本科學(xué)歷中的多,這應(yīng)該碩士樣本量較小有關(guān)掘譬。
五削罩、結(jié)論
1欣舵、廣東地區(qū)深圳萌朱、廣州兩地對數(shù)據(jù)分析師需求量最大狠毯;
2藐握、社會各個行業(yè)都需要數(shù)據(jù)分析師,其中互聯(lián)網(wǎng)/電子商務(wù)垃喊、金融猾普、零售及其相關(guān)行業(yè)的需求最為旺盛;
3本谜、1-3年工作經(jīng)驗的數(shù)據(jù)分析師缺口最大初家,3年以上經(jīng)驗數(shù)據(jù)分析師出現(xiàn)高薪的概率增加;
4耕突、數(shù)據(jù)分析師學(xué)歷門檻不高笤成,但若想獲得長遠發(fā)展,本科及以上學(xué)歷是有一定必要的眷茁;
5、警惕不限學(xué)歷纵诞、不限工作經(jīng)歷上祈、高薪的求職陷阱。