Life is short, you need Python排拷。Python 是一門很優(yōu)雅的語(yǔ)言猎唁,用著挺舒服的误证。所以就在想倔幼,現(xiàn)在的 Python 開(kāi)發(fā)的崗位招聘盖腿,公司們需要什么樣的人才?要有什么樣的技能损同?以及對(duì)應(yīng)的市場(chǎng)如何翩腐?
所以,我又有了一個(gè)大膽的想法膏燃。
爬取了前程無(wú)憂上 Python 關(guān)鍵字的招聘崗位茂卦,地區(qū)鎖定在中國(guó)四個(gè)一線城市,北上深廣组哩。選取 top650 條招聘崗位帶 Python 關(guān)鍵字的招聘信息進(jìn)行數(shù)據(jù)分析等龙。
崗位分布
650 條招聘信息中,各城市崗位數(shù)量分布如下圖伶贰。
上海 228 是最多的蛛砰,北京 202 排在第二,兩者都超過(guò)了 200黍衙,深圳和廣州就和上海北京差得有點(diǎn)多了泥畅,分別只有 115 和 91,另外還有 14 個(gè)是異地招聘的琅翻。當(dāng)然數(shù)據(jù)只是針對(duì)這前 650 條數(shù)據(jù)而言涯捻!不過(guò)總體上也差不多,后面的招聘信息都只是在崗位要求里提到 Python 而已望迎,并沒(méi)有專門招聘 Python 開(kāi)發(fā)者。
職位要求
提取了所有的職位要求凌外,進(jìn)行分詞統(tǒng)計(jì)辩尊,清理沒(méi)意義的詞,統(tǒng)一英文字符康辑,如 Python 和 python 不區(qū)分大小摄欲。
提取前 50 個(gè)中文詞匯以及出現(xiàn)次數(shù)
開(kāi)發(fā),2100
熟悉,1842
經(jīng)驗(yàn),1268
工程師,897
工作,895
職位,842
能力,806
優(yōu)先,755
描述,753
軟件,682
技術(shù),677
負(fù)責(zé),660
職能,658
類別,654
設(shè)計(jì),562
系統(tǒng),559
要求,549
相關(guān),542
使用,529
良好,521
以上,502
框架,492
數(shù)據(jù)庫(kù),491
項(xiàng)目,429
團(tuán)隊(duì),424
了解,398
數(shù)據(jù),387
產(chǎn)品,352
熟練,349
精通,331
公司,321
任職,313
進(jìn)行,311
編程,309
平臺(tái),306
學(xué)習(xí),301
語(yǔ)言,300
具備,300
崗位職責(zé),296
溝通,292
代碼,284
互聯(lián)網(wǎng),280
具有,269
參與,263
分析,262
維護(hù),253
優(yōu)化,239
編寫(xiě),235
爬蟲(chóng),233
學(xué)歷,230
文檔,226
合作,219
軟件開(kāi)發(fā),218
高級(jí),213
常用,212
測(cè)試,205
需求,205
完成,200
這個(gè)詞頻排序挺有趣的轿亮,要來(lái)好好研究一下
(開(kāi)發(fā),2100)(熟悉,1842)(經(jīng)驗(yàn)胸墙,1268)我注,這是最多的三個(gè)。熟悉其實(shí)也就是相當(dāng)于有經(jīng)驗(yàn)了迟隅。表示程度上的詞也是頻頻出現(xiàn)(熟悉,1842)(良好,521)(熟練,349)(精通,331)但骨。其實(shí)我一直不太理解精通這個(gè)詞,什么程度上的熟練才能稱為精通智袭。個(gè)人感覺(jué)應(yīng)該對(duì)精通這個(gè)詞懷有敬畏之心奔缠。
(團(tuán)隊(duì),424)(參與,263)(合作,219)(溝通,292)(協(xié)作,108),這個(gè)更多的是強(qiáng)調(diào)團(tuán)隊(duì)開(kāi)發(fā)吼野,參與到團(tuán)隊(duì)開(kāi)發(fā)以及合作的重要性校哎,畢竟現(xiàn)在的項(xiàng)目的規(guī)模基本上已經(jīng)大到不是一個(gè)人就能完成的瞳步。順便提一下 Git 出現(xiàn)了剛好 100 次闷哆。
(分析,262)(維護(hù),253)(優(yōu)化,239),這三個(gè)詞應(yīng)該就是對(duì)個(gè)人能力的綜合描述了单起,具有分析問(wèn)題的能力抱怔,維護(hù)和優(yōu)化項(xiàng)目的能力,一個(gè)成熟的項(xiàng)目后期的維護(hù)和優(yōu)化是很重要的馏臭。
看看沒(méi)排進(jìn) top50 的其他詞匯
(專業(yè),199)(架構(gòu),173)(研發(fā),170)野蝇,這幾個(gè)詞看起來(lái)就厲害了,畢竟架構(gòu)這個(gè)不是隨便就能搞搞括儒。
(爬蟲(chóng),233)(抓取,140)(爬取,28)(正則表達(dá)式,31)绕沈,剛需剛需!0镅啊乍狐!
(獨(dú)立,153)(責(zé)任心,123)(強(qiáng)烈,69)(踏實(shí),26)(抗壓,17)(認(rèn)真,26)(熱愛(ài),53)(意識(shí),78)(邏輯,58)這應(yīng)該都是所要求的品質(zhì)和能力了吧。
(數(shù)據(jù)結(jié)構(gòu),106)(算法,198)(設(shè)計(jì)模式,33)回憶起了被《數(shù)據(jù)結(jié)構(gòu)》和《算法導(dǎo)論》統(tǒng)治的恐懼嗎固逗?
(分布式,97)(分布式系統(tǒng),29)(分布式計(jì)算,7)用心感受一下就行了浅蚪。
(開(kāi)源,112),(Github,29)這個(gè)也可以看出公司對(duì)開(kāi)源的這方面的重視了烫罩,這是一種學(xué)習(xí)能力的體現(xiàn)惜傲,也是對(duì)程序和代碼的熱愛(ài)。了解這個(gè)也能大概證明自己不是一個(gè)只會(huì)閉門造車的人贝攒。
接著來(lái)看一下英文詞匯盗誊,統(tǒng)計(jì)了 top20 的情況,看看作為一個(gè) Python 開(kāi)發(fā)者還需要什么技能,好幫助我們點(diǎn)亮自己的技能樹(shù)哈踱。
毫無(wú)疑問(wèn)荒适,Python 遙遙領(lǐng)先,這是必備的开镣。比較靠前的有 Linux, Django, Web, MySql, Redis刀诬。Web 也是 Python 很火的一個(gè)領(lǐng)域,相對(duì)應(yīng)的 Django, Flask, Tornado 這樣的 Web 框架才會(huì)得到這樣的重視邪财。Linux 這個(gè)也是剛需阿陕壹,雖然我一直在 Windows 下開(kāi)發(fā) Python,但我也挺喜歡 Linux 的卧蜓,沒(méi)事也折騰折騰帐要。前端的三劍客 HTML, CSS, JavaScript 也赫然在列,說(shuō)到底還是 Web 的原因弥奸。其他語(yǔ)言如 Java 和 C 也有所提及榨惠。數(shù)據(jù)庫(kù)的也出現(xiàn)了三個(gè),數(shù)據(jù)庫(kù)是每個(gè)程序開(kāi)發(fā)人員都應(yīng)該掌握的技能盛霎,畢竟數(shù)據(jù)最優(yōu)的存儲(chǔ)方式是放在數(shù)據(jù)庫(kù)里赠橙。API 這個(gè)詞提醒著我們要多看文檔,這個(gè)其實(shí)也就涉及到英語(yǔ)閱讀的問(wèn)題愤炸,Python 有著一個(gè)很棒的社區(qū)期揪,很多優(yōu)秀的類庫(kù),大部分的類庫(kù)都有詳細(xì)的文檔规个,而大多數(shù)都是英文的凤薛。所以擁有一定的英語(yǔ)閱讀能力是非常重要的,不要指望所有庫(kù)類都能有人給自己翻譯中文文檔诞仓。
所有詞語(yǔ)前 200 生成詞云
一直覺(jué)得詞云還是得黑色背景視覺(jué)沖擊更大一點(diǎn)缤苫。
職位情況
然后對(duì)職位進(jìn)行分析,這個(gè)問(wèn)題讓我頭可疼可疼了呢墅拭,因?yàn)闆](méi)有一個(gè)規(guī)范活玲,導(dǎo)致招聘信息上的職位寫(xiě)的是各式各樣,舉個(gè)例子吧谍婉。Python 高級(jí)開(kāi)發(fā)工程師和高級(jí) Python 開(kāi)發(fā)工程師是一個(gè)意思吧舒憾。Python 開(kāi)發(fā)工程師,python 開(kāi)發(fā)工程師穗熬,PYTHON 工程師這三是一個(gè)概念吧镀迂。有的甚至寫(xiě)著 Python 攻城師?唤蔗?招拙?以為自己萌萌噠唧瘾??别凤? 這樣統(tǒng)計(jì)起來(lái)也比較麻煩,找不到好辦法领虹,只能先進(jìn)行詞頻統(tǒng)計(jì)规哪,然后剩下的再進(jìn)行手動(dòng)歸類。最終被我歸為 20 個(gè)類別塌衰。
在爬蟲(chóng)和數(shù)據(jù)分析這塊還是有一定的市場(chǎng)的诉稍,開(kāi)發(fā)工程師是總的一個(gè)范稱吧,這個(gè)有特別要求高級(jí)和中級(jí)的最疆。聽(tīng)說(shuō)大數(shù)據(jù)現(xiàn)在也挺火的杯巨?
薪酬情況
下面來(lái)談?wù)剬?duì)應(yīng)的薪酬情況,在這 650 條信息中努酸,有 9 條是沒(méi)具體提到工資的服爷,另外還有 6 條是按天算工資的,不過(guò)這個(gè)是針對(duì)實(shí)習(xí)生的获诈。
,Python開(kāi)發(fā)工程師,北京
,Python開(kāi)發(fā)工程師,上海-長(zhǎng)寧區(qū)
,高級(jí)軟件開(kāi)發(fā)工程師(C++/Python)_互聯(lián)網(wǎng)金融項(xiàng)目,深圳-福田區(qū)
,python高級(jí)數(shù)據(jù)開(kāi)發(fā)工程師(阿基米德),上海
,阿里移動(dòng)-Python開(kāi)發(fā)工程師,廣州
,"Software
,服務(wù)端研發(fā)工程師-Python(萬(wàn)得子公司),上海
,Python研發(fā)工程師(北京),北京
,HY2-監(jiān)控系統(tǒng)開(kāi)發(fā)工程師-Python(深圳),深圳
248元/天,python爬蟲(chóng)實(shí)習(xí)生,上海-楊浦區(qū)
150元/天,"實(shí)習(xí)生(Java, Python)",上海-徐匯區(qū)
300元/天,Python web開(kāi)發(fā)實(shí)習(xí)生,上海-長(zhǎng)寧區(qū)
250元/天,***IT編程中小學(xué)講師助理(C++/Python方向),上海-楊浦區(qū)
120元/天,Python/Java實(shí)習(xí)生,北京-朝陽(yáng)區(qū)
120元/天,Python 數(shù)據(jù)開(kāi)發(fā)實(shí)習(xí)生,上海-徐匯區(qū)
除去這 15 條仍源,在剩下的 635 條里,我們來(lái)進(jìn)行具體討論舔涎。
工資的單位有 萬(wàn)/月笼踩,萬(wàn)/年,千/月 三種亡嫌,而且所寫(xiě)明的工資是一個(gè)范圍嚎于,如 1.2-1.5 萬(wàn)/月,10-20 萬(wàn)/年挟冠。這讓我沒(méi)辦法統(tǒng)計(jì)于购,因?yàn)檫@不是一個(gè)數(shù),是一個(gè)范圍而且這是一個(gè)字符串圃郊。
最后价涝,我按一個(gè)具體的比例處理所有的工資情況。[x, y] 為其范圍持舆,取 x + (y - x) * 0.4 的值色瘩。拿 1.0-1.5 萬(wàn)/月來(lái)說(shuō)就是取其范圍的差(1.5 - 1.0)= 0.5,來(lái)乘以一個(gè)比值 0.4(為什么是 0.4 呢逸寓,這個(gè)是我個(gè)人估計(jì)的居兆,畢竟我還沒(méi)參加過(guò)工作。因?yàn)閯傞_(kāi)始工作可能就是底薪竹伸,后來(lái)才慢慢增上去的泥栖。就假設(shè)認(rèn)為均值應(yīng)該是這個(gè))最后得到 1.0 + 0.2 = 1.2簇宽,1.2 就是所取的一個(gè)權(quán)重,就當(dāng)是該崗位的工資吧享。將處理完的數(shù)據(jù)存進(jìn)數(shù)據(jù)庫(kù)魏割。
先來(lái)看看總體的情況
大體上呈現(xiàn)一個(gè)先升后降的趨勢(shì),[1.1 - 1.5] 萬(wàn)/月是最多的一個(gè)范圍钢颂,> 2.5 萬(wàn)/月的也還不錯(cuò)钞它,有 26 個(gè)招聘職位。
看看各個(gè)城市的具體情況殊鞭。
北京
上海
深圳
廣州
從整體來(lái)看北京的待遇最好遭垛,其次是上海,接下來(lái)才是深圳和廣州操灿,真的符合北上深廣排名锯仪??趾盐?
因?yàn)楦鱾€(gè)城市的總的崗位數(shù)量不同庶喜,所以不能單從哪個(gè)范圍的數(shù)量大而且比較,那樣沒(méi)多大意義谤碳。所以應(yīng)該看比例溃卡。可以明顯的看到 在 2.1 - 2.5 以及 > 2.5 這兩種顏色塊上蜒简,北京和上面所占的比例是要高于深圳和廣州的瘸羡。而在 0 - 1.0 這個(gè)顏色塊上,廣州是最大的搓茬,幾乎都接近一半了犹赖。比較這四個(gè)后,很容得出北京的結(jié)構(gòu)是最合理的卷仑,底層的偏少峻村,上層的偏多,中層占了絕大部分锡凝。廣州反之粘昨。
還有一個(gè)異地招聘的
薪酬和職位對(duì)應(yīng)情況
再來(lái)看看高薪酬對(duì)應(yīng)的是什么職位。
總體 top10
Salary | Location | Post |
---|---|---|
4.1 | 北京-朝陽(yáng)區(qū) | Linux C++/Python高級(jí)研發(fā)工程師 |
3.6 | 深圳 | 高級(jí)python工程師 |
3.5 | 深圳-南山區(qū) | python后臺(tái)開(kāi)發(fā)工程師(10001263) |
3.5 | 異地招聘 | Python工程師(代招) |
3.4 | 上海-浦東新區(qū) | Python開(kāi)發(fā)工程師 |
3.3 | 北京-海淀區(qū) | python開(kāi)發(fā)工程師(J10904) |
3.2 | 北京-海淀區(qū) | python課程經(jīng)理 |
3.2 | 上海-楊浦區(qū) | 資深Python后端開(kāi)發(fā)/架構(gòu)師 |
3.1 | 上海-浦東新區(qū) | Python工程師 |
2.9 | 北京 | Python高級(jí)軟件工程師 |
北京 top10
Salary | Location | Post |
---|---|---|
4.1 | 北京-朝陽(yáng)區(qū) | Linux C++/Python高級(jí)研發(fā)工程師 |
3.3 | 北京-海淀區(qū) | python開(kāi)發(fā)工程師(J10904) |
3.2 | 北京-海淀區(qū) | python課程經(jīng)理 |
2.9 | 北京 | Python高級(jí)軟件工程師 |
2.8 | 北京-海淀區(qū) | 技術(shù)工程部-python開(kāi)發(fā)工程師-北京-02155 |
2.8 | 北京-海淀區(qū) | Python開(kāi)發(fā)工程師 |
2.7 | 北京-東城區(qū) | 移動(dòng)平臺(tái)后端高級(jí)開(kāi)發(fā)工程師(Go/Python) |
2.7 | 北京 | Python工程師(網(wǎng)絡(luò)爬蟲(chóng)方向) |
2.7 | 北京 | Python高級(jí)開(kāi)發(fā)工程師 |
2.7 | 北京 | python開(kāi)發(fā)工程師-KingFile |
上海 top10
Salary | Location | Post |
---|---|---|
3.4 | 上海-浦東新區(qū) | Python開(kāi)發(fā)工程師 |
3.2 | 上海-楊浦區(qū) | 資深Python后端開(kāi)發(fā)/架構(gòu)師 |
3.1 | 上海-浦東新區(qū) | Python工程師 |
2.8 | 上海 | 運(yùn)維開(kāi)發(fā)工程師(Python) |
2.7 | 上海-黃浦區(qū) | Python高級(jí)開(kāi)發(fā)工程師 |
2.7 | 上海-松江區(qū) | 高級(jí)Python開(kāi)發(fā)工程師 |
2.7 | 上海-黃浦區(qū) | 資深軟件工程師 (Python) |
2.7 | 上海-黃浦區(qū) | Python開(kāi)發(fā)培訓(xùn)講師(全職或兼職) |
2.5 | 上海-楊浦區(qū) | Python爬蟲(chóng)開(kāi)發(fā)工程師 |
2.5 | 上海-長(zhǎng)寧區(qū) | Python開(kāi)發(fā)工程師 |
深圳 top10
Salary | Location | Post |
---|---|---|
3.6 | 深圳 | 高級(jí)python工程師 |
3.5 | 深圳-南山區(qū) | python后臺(tái)開(kāi)發(fā)工程師(10001263) |
2.2 | 深圳-龍崗區(qū) | python工程師 |
2.2 | 深圳-南山區(qū) | Python高級(jí)開(kāi)發(fā)工程師 |
2.1 | 深圳-南山區(qū) | Python開(kāi)發(fā)工程師 |
2.0 | 深圳 | Python |
1.9 | 深圳-南山區(qū) | 資深Python開(kāi)發(fā)工程師 |
1.9 | 深圳-南山區(qū) | Python 軟件開(kāi)發(fā)工程師 |
1.9 | 深圳-羅湖區(qū) | Python開(kāi)發(fā)工程師 |
1.9 | 深圳-南山區(qū) | Python開(kāi)發(fā)工程師 |
廣州 top10
Salary | Location | Post |
---|---|---|
2.7 | 廣州-荔灣區(qū) | 高級(jí)python開(kāi)發(fā)工程師(12952) |
2.4 | 廣州 | 后端開(kāi)發(fā)C++/PYTHON(主程級(jí)別) |
2.4 | 廣州-天河區(qū) | 資深Python工程師 |
2.1 | 廣州-海珠區(qū) | Python開(kāi)發(fā)工程師 |
1.9 | 廣州-海珠區(qū) | 后端開(kāi)發(fā)工程師(Python方向) |
1.9 | 廣州 | python爬蟲(chóng)開(kāi)發(fā)工程師 |
1.7 | 廣州 | Python高級(jí)工程師 |
1.7 | 廣州 | Python開(kāi)發(fā)工程師 |
1.7 | 廣州-天河區(qū) | Python講師 |
1.7 | 廣州-天河區(qū) | python/c工程師 |
北京確實(shí)強(qiáng)窜锯,實(shí)力碾壓廣州张肾,廣州的 top1 在總體中排名第 24。
在各自的薪酬 top10 中锚扎,高級(jí)這個(gè)詞出現(xiàn)頻繁吞瞪,資深也有幾個(gè)。物以稀為貴驾孔,有技術(shù)不怕沒(méi)人招芍秆。能達(dá)到這么高的工資的惯疙,基本上也都應(yīng)該要有多年的開(kāi)發(fā)經(jīng)驗(yàn)了吧,不然從何而談資深妖啥。這個(gè)是時(shí)間累積下來(lái)的的經(jīng)驗(yàn)的資本霉颠。
書(shū)還是要多讀的,掌握多一項(xiàng)技能就多一個(gè)優(yōu)勢(shì)荆虱。也不要局限于只是專業(yè)方面的書(shū)掉分,全方位、多角度克伊、深層次、立體化提高自己的知識(shí)水平华坦,也能讓自己腹有詩(shī)書(shū)氣自華愿吹,萬(wàn)一找到女朋友了呢?
最后
一開(kāi)始只是想簡(jiǎn)單研究一下惜姐,后來(lái)發(fā)現(xiàn)數(shù)據(jù)的分析比數(shù)據(jù)的爬取要難得多犁跪,不過(guò)有難度才有意思。一定要提一句歹袁,正則表達(dá)式真是瑞士軍刀阿坷衍,在處理文本數(shù)據(jù)上真真是極好的!