想成為大數(shù)據(jù)人才?你得擁有這些能力械拍!

01 起

大數(shù)據(jù)行業(yè)持續(xù)升溫突勇,越來越多的人才涌進(jìn)這個(gè)行業(yè)射沟。

想知道這個(gè)行業(yè)需要什么樣的人才么?

大數(shù)據(jù)的問題就交給大數(shù)據(jù)去完成吧~~

我們按特定的職位名稱与境,爬取了拉勾網(wǎng)上成都地區(qū)所有大數(shù)據(jù)相關(guān)職位的招聘信息,并對(duì)這份數(shù)據(jù)做了多維度分析猖吴,得到了很多有價(jià)值的信息摔刁,構(gòu)成了一份大數(shù)據(jù)人才市場(chǎng)分析報(bào)告。

本文節(jié)選報(bào)告第四章內(nèi)容海蔽,對(duì)5類大數(shù)據(jù)相關(guān)職位的職位要求進(jìn)行文本分析共屈,給出人才市場(chǎng)上對(duì)這5類職位的能力(ability)要求和技能(skill)要求,供大家餐參考党窜。

一起來看看吧拗引!

02 分析方法

原始數(shù)據(jù)經(jīng)標(biāo)準(zhǔn)化處理后,有11類職位幌衣,發(fā)布的職位數(shù)如下表所示矾削, 我們選取職位數(shù)大于100的職位以及數(shù)據(jù)挖掘職位進(jìn)行分析。

數(shù)據(jù)處理流程如下豁护,主要利用python的jieba分詞:

  1. 加載自定義詞典(提取各類職位的職位描述關(guān)鍵詞n,v詞性TOP100哼凯,人工篩選(組合、刪除詞語)生成一個(gè)詞典)
  2. 利用dict(zip())和原始數(shù)據(jù)楚里,生成{職位:職位描述}字典
  3. 利用dictionary.get(key,None)將相同的key對(duì)應(yīng)的value字符串聯(lián)結(jié)
  4. 利用jieba.analyse.extracr()提取各類職位的職位描述長(zhǎng)文本的名詞断部、動(dòng)詞高頻詞,作為該職位的能力相關(guān)要求
  5. 利用jieba.posseg.cut()以及flag詞性篩選和dictionary.get(key,0)對(duì)字母單詞計(jì)數(shù)班缎,并降序排列蝴光,作為該職位的技能相關(guān)要求

一波操作之后,我們得到算法工程師达址、數(shù)據(jù)挖掘蔑祟、數(shù)據(jù)分析師、Java工程師沉唠、前端工程師這五類職位的能力要求做瞪。

03 職位能力需求分析

3.1 算法攻城獅

算法工程師能力要求(左圖)主要集中在模型、數(shù)學(xué)右冻、編程等偏理論性的能力上装蓬;技能要求(右圖)主要集中在Matlab、Hadoop纱扭、Java牍帚、Python等偏數(shù)學(xué)統(tǒng)計(jì)、數(shù)據(jù)庫乳蛾、建模等方面的軟件或語言上暗赶。

3.2 數(shù)據(jù)挖掘工

數(shù)據(jù)挖掘能力要求主要集中在建模鄙币、聚類、分類蹂随、統(tǒng)計(jì)十嘿、回歸、文本處理岳锁、標(biāo)簽等偏實(shí)際應(yīng)用的方面绩衷;技能要求主要集中在Python、SQL激率、SAS等偏挖掘咳燕、統(tǒng)計(jì)的工具上,對(duì)于Hadoop等數(shù)據(jù)庫相關(guān)的技能要求沒有算法工程師那么多乒躺。

3.3 數(shù)據(jù)分析獅

數(shù)據(jù)分析師能力要求主要集中在行業(yè)分析招盲、報(bào)表統(tǒng)計(jì)、報(bào)告專項(xiàng)等方面嘉冒,要求具有較高的業(yè)務(wù)思維和對(duì)行業(yè)的深刻理解曹货;技能要求主要集中在Excel、SQL讳推、PPT等偏展示性的工具上控乾,對(duì)于python等技能的要求沒有數(shù)據(jù)挖掘多。

3.4 Java攻城獅

Java工程師能力要求主要集中在編程娜遵、架構(gòu)設(shè)計(jì)蜕衡、數(shù)據(jù)庫、分布式等方面设拟;技能要求主要集中在Java慨仿、Spring、Linux纳胧、Oracle镰吆、HTML等方面,更加偏向于底層語言跑慕。

3.5 前端攻城獅

前端能力要求主要集中在可視化万皿、網(wǎng)頁、瀏覽器核行、工程化等方面牢硅;技能要求主要集中在CSS、Web芝雪、UI减余、HTML、Javascript等方面惩系,與Java工程師的技能要求差異明顯位岔。

04 總結(jié)

以上分析僅分析了幾個(gè)發(fā)布職位數(shù)較多的崗位如筛,對(duì)其職位要求的長(zhǎng)文本進(jìn)行了分析,給出了各崗位的能力要求和技能要求抒抬,作為求職者或是招聘方的參考杨刨,也可以繼續(xù)進(jìn)行時(shí)序分析(需要不同時(shí)間點(diǎn)的數(shù)據(jù)),從而洞察各類崗位人才能力需求的變動(dòng)情況擦剑。

比如可以檢測(cè)數(shù)據(jù)挖掘的技術(shù)動(dòng)向妖胀,如出現(xiàn)越來越多的NLP(自然語言處理)相關(guān)的職位要求。

以上分析較為粗淺抓于,僅供大家參考~

對(duì)了,基于本次成都地區(qū)拉勾網(wǎng)的招聘數(shù)據(jù)浇借,我還做了一個(gè)人才價(jià)格計(jì)算器捉撮,

人才價(jià)格計(jì)算器
輸入你的求職職位、求職公司規(guī)模妇垢、你的工作年限巾遭、學(xué)歷等信息,就可以估算你在成都地區(qū)的市場(chǎng)均價(jià)

感興趣的小伙伴可以參考這段代碼闯估,我上傳到我的github了灼舍。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市涨薪,隨后出現(xiàn)的幾起案子骑素,更是在濱河造成了極大的恐慌,老刑警劉巖刚夺,帶你破解...
    沈念sama閱讀 217,084評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件献丑,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡侠姑,警方通過查閱死者的電腦和手機(jī)创橄,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,623評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來莽红,“玉大人妥畏,你說我怎么就攤上這事“灿酰” “怎么了醉蚁?”我有些...
    開封第一講書人閱讀 163,450評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)鬼店。 經(jīng)常有香客問我馍管,道長(zhǎng),這世上最難降的妖魔是什么薪韩? 我笑而不...
    開封第一講書人閱讀 58,322評(píng)論 1 293
  • 正文 為了忘掉前任确沸,我火速辦了婚禮捌锭,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘罗捎。我一直安慰自己观谦,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,370評(píng)論 6 390
  • 文/花漫 我一把揭開白布桨菜。 她就那樣靜靜地躺著豁状,像睡著了一般。 火紅的嫁衣襯著肌膚如雪倒得。 梳的紋絲不亂的頭發(fā)上泻红,一...
    開封第一講書人閱讀 51,274評(píng)論 1 300
  • 那天,我揣著相機(jī)與錄音霞掺,去河邊找鬼谊路。 笑死,一個(gè)胖子當(dāng)著我的面吹牛菩彬,可吹牛的內(nèi)容都是我干的缠劝。 我是一名探鬼主播,決...
    沈念sama閱讀 40,126評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼骗灶,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼惨恭!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起耙旦,我...
    開封第一講書人閱讀 38,980評(píng)論 0 275
  • 序言:老撾萬榮一對(duì)情侶失蹤脱羡,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后免都,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體轻黑,經(jīng)...
    沈念sama閱讀 45,414評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,599評(píng)論 3 334
  • 正文 我和宋清朗相戀三年琴昆,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了氓鄙。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,773評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡业舍,死狀恐怖抖拦,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情舷暮,我是刑警寧澤侯谁,帶...
    沈念sama閱讀 35,470評(píng)論 5 344
  • 正文 年R本政府宣布迅涮,位于F島的核電站炉峰,受9級(jí)特大地震影響蚓曼,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜沥割,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,080評(píng)論 3 327
  • 文/蒙蒙 一耗啦、第九天 我趴在偏房一處隱蔽的房頂上張望凿菩。 院中可真熱鬧,春花似錦帜讲、人聲如沸衅谷。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,713評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽获黔。三九已至,卻和暖如春在验,著一層夾襖步出監(jiān)牢的瞬間玷氏,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,852評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工腋舌, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留盏触,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,865評(píng)論 2 370
  • 正文 我出身青樓侦厚,卻偏偏與公主長(zhǎng)得像耻陕,于是被迫代替她去往敵國(guó)和親拙徽。 傳聞我的和親對(duì)象是個(gè)殘疾皇子刨沦,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,689評(píng)論 2 354