Github
地址:https://github.com/JasonJe/memos/tree/master/jobs_data_analysis
爬取
爬取程序為crawl.py
直接運行即可進行爬取觅闽,python3 ./crawl.py
芹彬。
- 說明:爬取的招聘網(wǎng)站為拉勾網(wǎng),其職位詳情頁有反爬策略雌芽,即單個
cookies
不可連續(xù)獲取2
次詳情頁內(nèi)容,這里使用代理請求首頁來更新cookies
秋麸,保證正常的詳情頁爬取汁掠。
數(shù)據(jù)可視化
可視化文檔為data_analysis.ipynb
數(shù)據(jù)分析 & 可視化:
- 職位關鍵詞
Top 10
-
HR
活躍時間分布
通過分析HR
的活躍時間唠摹,可以知道在大概早上09:00 ~ 11:00
和下午14:00 ~ 18:00
這兩個時間段進行簡歷投遞會比較好。
- 工作年限要求比例
大部分企業(yè)需要的是工作經(jīng)驗為1 ~ 3年
或者3 ~ 5年
的求職者炎疆,其中需要工作經(jīng)驗3 ~ 5
年的需求最大卡骂。
- 平均月薪
在工作年限要求的角度下,這里統(tǒng)計得到的平均最低薪酬:15978.65
形入,平均最高薪酬:28998.44
全跨。
可以看出,薪酬隨著工作經(jīng)驗的增加也是水漲船高亿遂。
1 ~ 3年
經(jīng)驗的求職者平均最低月薪為12k
以上浓若,最低平均最高月薪為20k
以上盒使;3 ~ 5年
經(jīng)驗的求職者平均最低月薪為16k
以上,最低平均最高月薪為28k
以上七嫌。
- 學歷要求比例
- 平均月薪
在學歷要求要求的角度下少办,這里統(tǒng)計得到的平均最低薪酬:16114.64
,平均最高薪酬:29445.84
诵原。
- 公司規(guī)模比例
- 融資情況比例
- 融資情況與公司規(guī)模
這張圖展現(xiàn)了不同融資階段的公司規(guī)模英妓。
- 招聘地區(qū)分布
可以看出,主要的公司位置集中在南山
绍赛,福田
蔓纠,寶安
這三個區(qū)。
- 技能詞云
- 職位詳情
這里對爬取到的職位描述進行了分詞吗蚌,提取其中出現(xiàn)的關鍵詞腿倚,并做相關的統(tǒng)計。
- 中文關鍵字
Top 20
- 中文關鍵字
從上面的關鍵詞Top20
可以看出蚯妇,所招聘的職位更加強調(diào)的是技能的把握敷燎、熟悉程度,以及工作經(jīng)驗箩言、能力等硬贯。
- 英文關鍵字
Top 50
- 英文關鍵字
這張圖大致展示了職位需要大概掌握的技能,職位更加強調(diào)數(shù)據(jù)庫陨收、緩存饭豹、Linux
、網(wǎng)絡TCP
务漩、Web
等的掌握程度拄衰。
而就Python后端
而言,有些職位可能不僅僅要求掌握Python
這門語言饵骨,還會要求掌握Java
翘悉,Golang
,C/C++
等多門語言宏悦。