拉勾網(wǎng)招聘信息分析(三)

關于招聘信息簡單分析第三彈甘改,對招聘信息中融資情況歼培、工作經(jīng)驗嘴办、學歷要求和薪酬之間的關系進行簡單分析和數(shù)據(jù)可視化操作(本例中數(shù)據(jù)主要集中為Python相關職位分析)

分析工具

import pandas as pd
from pyecharts import Boxplot
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_csv("數(shù)據(jù)文件")
# matplotlib 中文顯示設置
plt.rcParams['font.sans-serif']=['SimHei']
# 取平均值為薪酬值
def avg_salary(salary):
    salary_list = salary.split('-')
    salary_min = salary_list[0][:-1]
    salary_max = salary_list[1][:-1]
    return (int(salary_min)+int(salary_max))/2.0

北京部分區(qū)縣薪酬比較

薪酬和區(qū)域之間關系數(shù)據(jù)處理

df["salary_avg"] = df["工資"].apply(avg_salary).astype(int)
groupy_by_dist = df.groupby(["區(qū)域"])["salary_avg"]
count_by_dist = df.groupby(['區(qū)域'])['區(qū)域'].count()
df_dist =[]
for group in count_by_dist.index:
    v = groupy_by_dist.get_group(group).values
    df_dist.append(v)
  • seaborn工具實現(xiàn)數(shù)據(jù)展示
ax = plt.figure(figsize=(10, 6)).add_subplot(111)
sns.boxplot(data=df_dist)
ax.set_xticklabels(count_by_dist.index, rotation=-30,fontsize=18)
ax.set_title('北京部分地區(qū)薪酬比較', fontsize=22)
ax.set_ylabel('薪酬K/月', fontsize=20)
plt.savefig('北京部分地區(qū)薪酬比較', bbox_inches='tight')
plt.show()
  • pycharts工具實現(xiàn)數(shù)據(jù)展示
boxplot = Boxplot("北京部分城區(qū)薪酬比較")
boxplot.use_theme("dark")
_yaxis = boxplot.prepare_data(df_dist)
boxplot.add("",count_by_dist.index , _yaxis,is_area_show=True,yaxis_name="薪酬(k/月)",is_label_show=True,
            is_axisline_show=True,is_fill=True,mark_point=["max","min","average"])
boxplot.render()
北京部分地區(qū)薪酬比較
北京部分地區(qū)薪酬比較

朝陽區(qū)薪酬最高弹谁,海淀區(qū)緊跟其后乾巧。并且北京各區(qū)Python職位薪資水平普遍還是較高的,薪酬分布最大值為25k(石景山區(qū))预愤、最小值為2K(海淀區(qū))沟于、平均值為11K(東城區(qū))。

不同工作經(jīng)驗的薪酬情況

薪酬和工作經(jīng)驗之間關系數(shù)據(jù)處理

count_by_experience = df.groupby(['工作經(jīng)驗'])['工作經(jīng)驗'].count()
value_by_experience = pd.DataFrame([count_by_experience.index, count_by_experience.values], index = ['experience', 'counts']).T
sort_by_experience = value_by_experience.copy()
mappings = {'應屆畢業(yè)生':1, '1年以下':2, '1-3年':3, '3-5年':4, '5-10年':5, '10年以上':6,'不限':7}
sort_by_experience['sortby'] = sort_by_experience['experience'].map(mappings)
sort_by_experience.sort_values(by='sortby', inplace=True)

df["salary_avg"] = df["工資"].apply(avg_salary).astype(int)
groupy_by_experience = df.groupby(['工作經(jīng)驗'])["salary_avg"]
df_exper = []
for group in sort_by_experience["experience"]:
    v = groupy_by_experience.get_group(group).values
    df_exper.append(v)
  • seaborn工具實現(xiàn)數(shù)據(jù)展示
ax = plt.figure(figsize=(10,6)).add_subplot(111,axisbg='#FFDAB9')
# add_subplot(111)
sns.boxplot(data=df_exper)
ax.set_xticklabels(sort_by_experience["experience"],fontsize=18)
ax.set_title('不同工作經(jīng)驗的薪酬分布',fontsize=20)
ax.set_ylabel('薪酬K/月', fontsize=20)
plt.savefig('不同工作經(jīng)驗的薪酬分布')
plt.show()
  • Pyecharts工具實現(xiàn)數(shù)據(jù)展示
from pyecharts import Boxplot
boxplot = Boxplot("不同工作經(jīng)驗的薪酬分布")
boxplot.use_theme("dark")
_yaxis = boxplot.prepare_data(df_exper)

boxplot.add("",sort_by_experience["experience"] , _yaxis,is_area_show=True,yaxis_name="薪酬(k/月)",is_label_show=True,
            is_axisline_show=True,mark_point=["max","min","average"],
            is_geo_effect_show=True)
boxplot.render("exp_sal.html")
不同工作經(jīng)驗的薪酬分布

不同工作經(jīng)驗的薪酬分布

工作經(jīng)驗和薪資呈正相關分布鳖粟,而3-5年和5-10年工作經(jīng)驗基本代表Python職位薪資普遍薪酬社裆。薪酬分布最大值為40k(10年以上)、最小值為2K(應屆畢業(yè)生)向图、平均值為11K(3-5年)泳秀。

不同學歷要求的薪酬分布

學歷要求和薪酬之間關系數(shù)據(jù)處理

count_by_degree = df.groupby(['學歷要求'])['學歷要求'].count()
value_by_degree = pd.DataFrame([count_by_degree.index, count_by_degree.values], index = ['degree', 'counts']).T
sort_by_degree = value_by_degree.copy()
degree_mappings = {'不限':1, '大專':2, '本科':3, '碩士':4,'博士':5}
sort_by_degree['sortby'] = sort_by_degree['degree'].map(degree_mappings)
sort_by_degree.sort_values(by='sortby', inplace=True)
df["salary_avg"] = df['工資'].apply(avg_salary).astype(int)
group_by_degree = df.groupby(['學歷要求'])['salary_avg']
df_deg = []
for group in sort_by_degree['degree']:
    v = group_by_degree.get_group(group).values
    df_deg.append(v)
  • seaborn工具實現(xiàn)數(shù)據(jù)展示

    ax = plt.figure(figsize=(10, 8)).add_subplot(111,axisbg='#FFDAB9')
    sns.boxplot(data=df_deg)
    ax.set_xticklabels(sort_by_degree['degree'], fontsize=18)
    ax.set_title('不同學歷的薪酬分布', fontsize=22)
    ax.set_ylabel('薪酬K/月', fontsize=20)
    plt.savefig('不同學歷的薪酬分布')
    plt.show()```
    
  • Pyecharts工具實現(xiàn)數(shù)據(jù)展示

    from pyecharts import Boxplot
    boxplot = Boxplot("不同學歷要求的薪酬分布")
    boxplot.use_theme("dark")
    _yaxis = boxplot.prepare_data(df_deg)
    boxplot.add("",sort_by_degree["degree"] , _yaxis,is_area_show=True,yaxis_name="薪酬(k/月)",is_label_show=True,
                  is_axisline_show=True,mark_point=["max","min","average"],
                  is_geo_effect_show=True)
    boxplot.render("deg_sal.html")
    
不同學歷的薪酬分布
不同學歷要求的薪酬分布

同樣學歷和薪資呈正相關分布,而大專和本科基本代表Python職位薪資普遍薪酬榄攀。薪酬分布最大值為35k(博士)嗜傅、最小值為2K(碩士)、平均值為7K(不限)檩赢。而由于數(shù)據(jù)樣本過于集中導致數(shù)據(jù)分析結(jié)果出現(xiàn)極值吕嘀,本科占整個數(shù)據(jù)比例為90%左右。

公司融資情況和薪酬之間關系

公司融資情況和薪酬之間關系數(shù)據(jù)處理

count_by_financing = df.groupby(['融資階段'])['融資階段'].count()
value_by_financing = pd.DataFrame([count_by_financing.index, count_by_financing.values], index = ['financing', 'counts']).T
sort_by_financing = value_by_financing.copy()
mappings = {'未融資':1, '天使輪':2, 'A輪':3, 'B輪':4, 'C輪':5,'D輪及以上':6, '上市公司':7,'不需要融資':8}
sort_by_financing['sortby'] = sort_by_financing['financing'].map(mappings)
sort_by_financing.sort_values(by='sortby', inplace=True)

df["salary_avg"] = df["工資"].apply(avg_salary).astype(int)
groupy_by_financing = df.groupby(['融資階段'])["salary_avg"]
df_financing = []
for group in sort_by_financing["financing"]:
  v = groupy_by_financing.get_group(group).values
  df_financing.append(v)
  • seaborn工具實現(xiàn)數(shù)據(jù)展示
    ax = plt.figure(figsize=(10,6)).add_subplot(111,axisbg='#FFDAB9')
    sns.boxplot(data=df_financing)
    ax.set_xticklabels(sort_by_financing["financing"],rotation=-45,fontsize=18)
    ax.set_title('融資情況和薪酬之間的關系',fontsize=20)
    ax.set_ylabel('薪酬K/月', fontsize=20)
    plt.savefig('融資情況和薪酬之間的關系')
    plt.show()
    
  • Pyecharts工具實現(xiàn)數(shù)據(jù)展示
    from pyecharts import Boxplot
    boxplot = Boxplot("融資情況和薪酬之間的關系")
    boxplot.use_theme("dark")
    _yaxis = boxplot.prepare_data(df_financing)
    boxplot.add("",sort_by_financing["financing"] , _yaxis,is_area_show=True,yaxis_name="薪酬(k/月)",is_label_show=True,
                  is_axisline_show=True,mark_point=["max","min","average"],
                  is_geo_effect_show=True)
    boxplot.render("financing_sal.html")
    
融資情況和薪酬之間的關系
融資情況和薪酬之間的關系

公司融資和薪資關系并不是很緊密,公司獲得天使輪投資的Python職位薪資相對較高偶房。薪酬分布最大值為6k(天使輪)趁曼、最小值為2K(A輪)、平均值為3K(B輪)棕洋。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末挡闰,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子掰盘,更是在濱河造成了極大的恐慌摄悯,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件愧捕,死亡現(xiàn)場離奇詭異奢驯,居然都是意外死亡,警方通過查閱死者的電腦和手機次绘,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門瘪阁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人断盛,你說我怎么就攤上這事罗洗。” “怎么了钢猛?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵伙菜,是天一觀的道長。 經(jīng)常有香客問我命迈,道長贩绕,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任壶愤,我火速辦了婚禮淑倾,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘征椒。我一直安慰自己娇哆,他們只是感情好,可當我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布勃救。 她就那樣靜靜地躺著碍讨,像睡著了一般。 火紅的嫁衣襯著肌膚如雪蒙秒。 梳的紋絲不亂的頭發(fā)上勃黍,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天,我揣著相機與錄音晕讲,去河邊找鬼覆获。 笑死马澈,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的弄息。 我是一名探鬼主播痊班,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼疑枯!你這毒婦竟也來了辩块?” 一聲冷哼從身側(cè)響起蛔六,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤荆永,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后国章,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體具钥,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年液兽,在試婚紗的時候發(fā)現(xiàn)自己被綠了骂删。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡四啰,死狀恐怖宁玫,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情柑晒,我是刑警寧澤欧瘪,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站匙赞,受9級特大地震影響佛掖,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜涌庭,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一芥被、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧坐榆,春花似錦拴魄、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至愉昆,卻和暖如春职员,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背跛溉。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工焊切, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留扮授,地道東北人。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓专肪,卻偏偏與公主長得像刹勃,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子嚎尤,可洞房花燭夜當晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容