轉(zhuǎn)載請(qǐng)?jiān)谖恼缕鹗继幾⒚鞒鎏幐洗伲x謝社付。
一好芭、項(xiàng)目背景及目的
都說“男怕入錯(cuò)行”燃箭,既然想從事“數(shù)據(jù)分析師”這個(gè)崗位,那自然要對(duì)這個(gè)崗位有所了解舍败。
本項(xiàng)目通過爬取拉鉤網(wǎng)上該崗位的招聘信息招狸,并進(jìn)行分析,指導(dǎo)自己學(xué)習(xí)相關(guān)技能及準(zhǔn)備簡歷邻薯。通過分析可以知道:
1裙戏、公司對(duì)數(shù)據(jù)分析師的招聘要求如何,比如學(xué)歷厕诡、工作年限累榜?一般什么樣的公司會(huì)招數(shù)據(jù)分析師?
2灵嫌、數(shù)據(jù)分析師的福利如何壹罚,是不是一個(gè)具有吸引力的崗位?
3寿羞、公司需要應(yīng)聘者具備哪些能力猖凛,在工作中會(huì)用到哪些工具?
4绪穆、招聘公司的地域分布辨泳?
5虱岂、影響薪酬的因素有哪些?具體表現(xiàn)在哪些方面漠吻?
明確目的之后量瓜,我們就開始吧!
二途乃、項(xiàng)目流程
1绍傲、數(shù)據(jù)獲取與存儲(chǔ)
數(shù)據(jù)獲取有很多方式,比如網(wǎng)上下載公開數(shù)據(jù)耍共、購買數(shù)據(jù)烫饼,如果公司有自己的數(shù)據(jù)庫,可以直接調(diào)取數(shù)據(jù)進(jìn)行分析试读,也可以通過編寫爬蟲杠纵、使用爬蟲工具等方式獲得。
由于拉鉤網(wǎng)專注互聯(lián)網(wǎng)招聘钩骇,數(shù)據(jù)較其他網(wǎng)站更簡潔完整比藻,且數(shù)據(jù)都是JSON格式,方便獲取倘屹,所以本項(xiàng)目通過Python編寫爬蟲來爬取數(shù)據(jù)银亲。
通過爬蟲獲取到:內(nèi)容字段崗位名稱title、月薪month_salary纽匙、公司名稱company务蝠、所屬行業(yè)industry、公司規(guī)模companySize烛缔、融資階段financeStage馏段、所在城市city、經(jīng)驗(yàn)要求experience践瓷、學(xué)歷要求education院喜、全職/兼職jobNature、職位描述及任職要求description等信息晕翠。
由于拉鉤網(wǎng)限制展示數(shù)據(jù)為450條喷舀,數(shù)據(jù)較少,所以獲取到數(shù)據(jù)后直接寫入到Excel中崖面,也可以寫入到MySQL等數(shù)據(jù)庫中元咙。
2梯影、數(shù)據(jù)清洗巫员、分析
爬取到的數(shù)據(jù)如下圖:
可以看到獲得的數(shù)據(jù)中有“-”甲棍、“[]”等符號(hào)简识,有數(shù)據(jù)缺失、重復(fù)現(xiàn)象,所以需要先在表中將數(shù)據(jù)轉(zhuǎn)換成我們所需要的格式七扰。處理數(shù)據(jù)前要先將原始數(shù)據(jù)進(jìn)行備份奢赂,方便后續(xù)查詢。處理完的數(shù)據(jù)有429條颈走,可以拿來進(jìn)行分析了膳灶。
1)、首先立由,看一下數(shù)據(jù)分析師崗位關(guān)于學(xué)歷及工作年限的要求轧钓,以及招聘公司的情況:
可以看出招聘需求學(xué)歷主要為本科,其次是大專锐膜、研究生毕箍。
工作經(jīng)驗(yàn)的需求分布近似于正態(tài)分布。工作3-5年工作經(jīng)驗(yàn)的分析師需求量最大道盏,其次是1-3年經(jīng)驗(yàn)的熟手而柑。工作經(jīng)驗(yàn)不足1年的新人,市場需求量比較少荷逞。另外媒咳,工作經(jīng)驗(yàn)要5-10年的需求量非常稀少。
幾乎所有公司都需要數(shù)據(jù)分析師颅围,D輪之后需求量相對(duì)較大伟葫。需求最多的兩個(gè)行業(yè)是“移動(dòng)互聯(lián)網(wǎng)”、“金融”院促,從一個(gè)側(cè)面也反映出越來越多的公司注重?cái)?shù)據(jù)筏养,尤其是變化最快的互聯(lián)網(wǎng)行業(yè)。不過有一個(gè)有趣的情況是:剛完成A輪常拓、B輪的公司對(duì)數(shù)據(jù)分析師需求較多渐溶,天使輪需求較少,可能是由于公司剛成立弄抬,不需要專門設(shè)立該崗位茎辐,隨著公司越大,部門越多掂恕,分工越明確拖陆。
從上圖可以看出,數(shù)據(jù)分析師更多的屬于產(chǎn)品這一類懊亡,畢竟產(chǎn)品數(shù)據(jù)不分家依啰。
可以看出:
? ??數(shù)據(jù)分析師這個(gè)崗位學(xué)歷門檻不是特別高,只要有本科文憑機(jī)會(huì)就挺多的店枣。
? ? 數(shù)據(jù)分析這個(gè)崗位是一個(gè)比較年輕的崗位速警,大量崗位需要1~3年叹誉、3~5年工作經(jīng)驗(yàn)。
? ? “移動(dòng)互聯(lián)網(wǎng)”闷旧、“金融”是兩個(gè)需求最多的行業(yè)长豁,不同階段的公司都有自己的數(shù)據(jù)分析崗位。
? ? 數(shù)據(jù)分析師一般屬于“產(chǎn)品”類崗位忙灼。
2)匠襟、接下來再看一下數(shù)據(jù)分析師福利如何,有沒有吸引力:
通過對(duì)職位標(biāo)簽该园、招聘公司標(biāo)簽進(jìn)行詞云分析宅此,如下圖:
可以看出,數(shù)據(jù)分析師崗位最明顯的標(biāo)簽為“福利”爬范,其次有“彈性”父腕、“年終獎(jiǎng)”、“團(tuán)隊(duì)”青瀑、“氛圍”璧亮、“晉升”、“待遇”等斥难。招聘公司出現(xiàn)最多的標(biāo)簽為“獎(jiǎng)金”枝嘶,其次有“績效”、“期權(quán)”哑诊、“帶薪年假”群扶、“股票”等。
可以看出數(shù)據(jù)分析師的待遇及前景是有前途的镀裤、誘人的竞阐,招聘公司為了招到合適的員工也是甘愿下大價(jià)錢。此外“團(tuán)隊(duì)”說明這份工作需要分工合作暑劝,團(tuán)隊(duì)配合骆莹。
3)、再來看看企業(yè)要求應(yīng)聘者所具備的能力担猛,同樣通過詞云分析如下:
詞云顯示出的情況幕垦,可以看出:對(duì)于數(shù)據(jù)分析師這一崗位,企業(yè)需求頻率最高的技能并不是 Python 語言和R語言等如今非常時(shí)髦的數(shù)據(jù)分析語言傅联,而是傳統(tǒng)的結(jié)構(gòu)化查詢語言SQL和表格神器Excel先改。看來要想從事數(shù)據(jù)分析師崗位,SQL和Excel是必備技能蒸走。
從詞云上看出仇奶,數(shù)據(jù)分析師技能需求頻率排在前列的有:SQL,Excel, SAS载碌,SPSS, Python, Hadoop和MySQL等猜嘱。另外,Java, PPT, BI軟件等屬于第二梯隊(duì)嫁艇。
4)朗伶、招聘公司分布情況如何呢?
由于爬取的數(shù)據(jù)為上海市的步咪,那可以看一下不同區(qū)內(nèi)公司分布情況论皆,將公司地址中不同區(qū)進(jìn)行分類統(tǒng)計(jì),更直觀一點(diǎn)猾漫,使用BDP進(jìn)行可視化展示:
這張熱力圖可以看出点晴,絕大多數(shù)招聘公司集中在內(nèi)環(huán),交通極為便利悯周。但公司在浦東新區(qū)粒督、閔行的看起來也不少,那是否說明郊區(qū)也有大量的招聘企業(yè)呢屠橄?為了印證這個(gè)問題长酗,我們把公司所屬商圈進(jìn)行統(tǒng)計(jì)之拨,發(fā)現(xiàn)大量公司集中在浦東的張江佳簸、陸家嘴听想、花木,閔行的漕寶路垫卤、華漕舔痕、莘莊等IT、金融企業(yè)聚集地。通過地圖可看出,這些位置與上述“絕大多數(shù)招聘公司集中在內(nèi)環(huán),交通極為便利”描述是一致的。
5)模她、最后讓我們來看看最關(guān)心的薪資待遇。
首先看一下大概的一個(gè)薪資分布:
大多數(shù)職位薪資為10~15k旋膳,但高薪數(shù)量也不少尸变,可以看出數(shù)據(jù)分析師的薪酬收入整體還是可觀的,從這方面說,選擇這個(gè)職業(yè)還是不錯(cuò)的漫谷。
不同階段公司提供薪水如何?
從中位數(shù)可以看出蹂析,越大的公司越能提供較高的平均薪資舔示,而剛起步的公司薪資相對(duì)要少一些。但如果能力過硬电抚、經(jīng)驗(yàn)豐富惕稻,則可以在不同階段的公司中拿到高薪。所以蝙叛,如果想拿高薪俺祠,大公司是不錯(cuò)的選擇。
這張圖可以看出借帘,隨著工作年限增長蜘渣,薪酬呈上升趨勢(shì),可見數(shù)據(jù)分析是一份長青的崗位肺然。1~3年工作經(jīng)驗(yàn)可以拿到12k左右的薪酬蔫缸,而3~5年則可以拿到20k。
所以說际起,想拿高薪拾碌,需要更高的工作年限,換句話說需要更強(qiáng)的自身能力街望,較大的公司可以提供更為可觀的平均薪酬倦沧。
三、分析結(jié)論
通過上述分析它匕,結(jié)合自身實(shí)際情況可知:
1展融、數(shù)據(jù)分析師是一份非常有前景的職業(yè),不同階段的公司都需要數(shù)據(jù)分析師,更多情況下屬于產(chǎn)品部門告希;
2扑浸、大部分招聘公司集中在市區(qū),交通極為便利燕偶;
3喝噪、Excel+SQL是必須,如果想再進(jìn)一步提高指么,更有發(fā)展酝惧,則需要學(xué)習(xí)?SAS,SPSS, Python中一個(gè)或多個(gè)伯诬;
4晚唇、薪酬方面,1~3年工作經(jīng)驗(yàn)一般月薪10~20k盗似,平均可拿到12k哩陕。當(dāng)然能力越強(qiáng)可以拿的越多,大的公司可以提供相對(duì)較多的薪酬赫舒。
四悍及、總結(jié)
通過數(shù)據(jù)分析,讓我大致了解到“數(shù)據(jù)分析師”招聘的一些情況接癌,更有針對(duì)性地強(qiáng)化相關(guān)技能心赶,也指導(dǎo)我更新與投遞簡歷。但此次的分析還是有些不足:數(shù)據(jù)量較少缺猛,分析工具主要使用的是Excel园担,而真正的數(shù)據(jù)分析則會(huì)面對(duì)更海量的數(shù)據(jù)、使用更有效的分析工具枯夜。此外數(shù)據(jù)分析師所需要具備的素質(zhì)遠(yuǎn)不止這些工具弯汰,還需要有扎實(shí)的數(shù)學(xué)、統(tǒng)計(jì)學(xué)基礎(chǔ)湖雹,良好的數(shù)據(jù)敏感度咏闪,開拓嚴(yán)謹(jǐn)?shù)乃季S等,這也是我下一步需要學(xué)習(xí)的方向摔吏。