想知道你的工作值多少錢?如果想小范圍內(nèi)轉(zhuǎn)行懂扼,轉(zhuǎn)哪個比較好呢赶熟?
IT人恐怕逃脫不了加班這個魔咒,有的人想轉(zhuǎn)行啊央,最好是錢多事少離家近逝撬。 Snake 從拉勾網(wǎng)爬取職位信息溯警,通過分析城市狡相,職位和薪水的分布的情況梯轻,來探討IT的發(fā)展趨勢。
雖然數(shù)據(jù)可能有些不準(zhǔn)尽棕,“窺一斑而知全豹”喳挑。
首先挑幾個維度做樣本,如下:
cities = np.array(['北京', '上海', '廣州', '深圳', '杭州'])
salaries = np.array(['2k-5k', '5k-10k', '10k-15k', '15k-25k', '25k-50k'])
keywords = np.array(["測試", "Android", "IOS", "前端", "人工智能", "后端", "運維"])
翠花滔悉,上爬蟲!
def get_page(url, page_num, keyword):
headers = {
"User-Agent": "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)",
"Accept": "application/json, text/javascript, */*; q=0.01",
"Content-Type": "application/x-www-form-urlencoded; charset=UTF-8",
"Accept-Encoding": "gzip, deflate, br",
"Accept-Language": "zh-CN,zh;q=0.8"
}
if page_num == 1:
boo = 'true'
else:
boo = 'false'
page_data = {
'first': boo,
'pn': page_num,
'kd': keyword
}
page = requests.post(url=url, headers=headers, data=page_data)
return page.json()
def get_detail(keyword):
final_result = []
for city in cities:
total_count = []
for salary in salaries:
result = get_page(url.format(city, salary), 1, keyword)['content']['positionResult']['totalCount']
total_count.append(result)
final_result.append(total_count)
detail[keyword] = final_result
爬到的數(shù)據(jù)如下:
圖形化回官,更直觀點:
-
測試
-
Android開發(fā)
-
IOS開發(fā)
-
前端開發(fā)
-
人工智能
-
后端開發(fā)
-
運維
PS曹宴,原諒我還沒完全解決Mac繪圖中文字體問題,將就看把歉提。
從數(shù)據(jù)可以看到笛坦,無論哪個崗位,職位最多的非帝都莫屬苔巨。
杭州超過了廣州版扩。(馬云功不可沒)
各個職位對中級需求相對多些,帝都對15--25K的需求比較大恋拷。(帝都的房價资厉,難道是IT人員撐起來的?我知道一個華為的蔬顾,帝都好幾套)
測試和運維的分布很接近宴偿。
開發(fā)的薪資和測試的薪資湘捎,距離沒有那么大了。(經(jīng)過這么多年的發(fā)展窄刘,開發(fā)的薪資已經(jīng)很理性了窥妇。)
人工智能已經(jīng)起來了,高薪機(jī)會很多娩践。(難道是下一個風(fēng)口活翩,希望不是泡沫)
以上是個人愚見,如有不準(zhǔn)翻伺,請找招聘網(wǎng)站材泄。我頂多就放了個??。
更多精彩吨岭,請關(guān)注: python愛好部落