1.按照招聘職位數(shù)量進(jìn)行排序:
發(fā)現(xiàn)北京萬向有限公司的數(shù)據(jù)異常高若未,去智聯(lián)招聘網(wǎng)站上進(jìn)行搜索:
點(diǎn)進(jìn)該公司發(fā)布的一些職位弓颈,發(fā)現(xiàn)招聘要求屬于籠統(tǒng)的概括且內(nèi)容差異不大,
沒有明確的職能區(qū)分;判定該公司走培訓(xùn)模式的概率很大遍坟,故作為異常值移除裤翩。
移除異常值后资盅,招聘數(shù)量前10的公司:
2.進(jìn)行招聘的公司中,股份制和民營的企業(yè)的職位較多踊赠,國企和事業(yè)單位發(fā)布的職位很少:
3.招聘職位較多的公司規(guī)模:100-499人和500-999人的企業(yè)
? ?很大型的公司和很小型的公司需求都一般呵扛,可見很成熟的企業(yè)職位相對穩(wěn)定,
? ?需求不是太多筐带;很小的公司剛起步今穿,還沒發(fā)展起來,職位也不會太多
4.各地區(qū)對于數(shù)據(jù)分析師的需求:
? 如熱力圖所示伦籍,北京地區(qū)的招求遙遙領(lǐng)先蓝晒,其次是上海、廣州帖鸦,南京和杭州也緊隨其后
??5.除去不限學(xué)歷的芝薇,對大專和本科學(xué)歷的需求最普遍;
? ? 這應(yīng)該是考慮了社會本身的學(xué)歷輸出以及公司招聘時的用人成本
6.對于工作經(jīng)驗(yàn)的要求富蓄,除去空白的剩燥,大部分在1到3年,無經(jīng)驗(yàn)也有一定占比立倍,
? 數(shù)據(jù)分析師作為比較新興的職位灭红,目前的需求還是偏向初級崗位
7.細(xì)化了工資區(qū)間,在3500-6500工資的人群比較多
8.20人以下的公司給的薪資很高口注,1000到9999人的公司給的薪資次之变擒;
由于這里的薪資數(shù)據(jù)是平均值,20人以下的公司人數(shù)較少寝志,故無法平衡極端值娇斑;
而10000人以上的公司由于人數(shù)眾多策添,極端值也可以被平衡掉。
9.國企和事業(yè)單位的平均薪資較高
10.一般來說毫缆,學(xué)歷越高唯竹,工資越高,但這里沒有考慮工作經(jīng)驗(yàn)的因素
11.將崗位職責(zé)的要求復(fù)制粘貼到文本文檔data-analysis.txt中苦丁,
打開jupyter notebook浸颓,新建一個python文件,輸入以下代碼:
filename = "data-analysis.txt"
with open(filename) as f:
mytext = f.read()
import jieba
mytext = " ".join(jieba.cut(mytext))
from wordcloud import WordCloud
wordcloud = WordCloud(font_path="simsun.ttf").generate(mytext)
%pylab inline
import matplotlib.pyplot as plt
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
根據(jù)詞云分析的結(jié)果旺拉,數(shù)據(jù)分析師的主要任務(wù)就是對數(shù)據(jù)進(jìn)行分析产上,同時對于專業(yè)有一定的要求,學(xué)歷要求大專及以上