资讯专栏INFORMATION COLUMN

「数据游戏」:数据告诉你多读书到底能不能多赚钱?

Ryan_Li / 1266人阅读

摘要:今天,我就用数据告诉你,书中到底有没有黄金屋。绘制分组数据的条形图。我们可以看到轮的公司开放给大专学历的岗位相比轮有一个断崖式的下跌。绘制不同学历的最低薪资与最高薪资分布直方图。

北起漠河南至曾母暗沙,东达抚远西至斯姆哈纳。在广袤的中国土地上,千百年一直流传着古老的传说:书中自有黄金屋。

今天,我就用数据告诉你,书中到底有没有黄金屋。

数据来源

利用 Max 的拉勾爬虫爬取了拉勾杭州站,要求3~5年工作经验的1000条招聘数据。

简单数据分析

疑问1:不同学历进的公司规模有明显不同吗?

positionlist_grouped = positionlist.groupby(by = ["companySize","education"],as_index = False).count()

将数据按照公司规模与教育程度分组。

plt.rcParams["font.family"] = ["Arial Unicode MS"] 
plt.rcParams["axes.unicode_minus"] = False 
 
sns.set_style("whitegrid",{"font.sans-serif":["Arial Unicode MS","Arial"]})


# Draw a nested barplot to show survival for class and sex
g = sns.catplot(x="companySize", y="positionId", hue="education", data=positionlist_grouped,
                height=6, kind="bar", palette="muted")
g.despine(left=True)
g.set_ylabels("count");

绘制分组数据的条形图。

从图上可以看到,虽然明确要求硕士的岗位比较少,但是不同规模的公司对学习要求的分布基本一致。

不同学历进的公司规模没有明显不同。

疑问2:不同学历进的公司财务状况有明显不同吗?

做法与疑问1一样,区别是将数据按照财务状况和学历进行分组,然后绘制分布的条形图。

groupbyfe = positionlist.groupby(by = ["financeStage","education"],as_index = False).count()

我们可以看到 C 轮的公司开放给大专学历的岗位相比 B 轮有一个断崖式的下跌。饼图会更明显的反应出这个现象。

plt.pie("positionId",labels = "financeStage",data = groupbyfe[groupbyfe["education"] == "大专"],autopct="%1.1f%%")
plt.title("专科");
....
....# 省略了绘制本科的代码
....# 省略了绘制硕士的代码

对比三个饼图,注意观察本科和专科,B、C 轮公司的分布,我们可以看到 C 轮的公司提供给专科学历的人的岗位占比非常的低。

所以对于疑问2,我的看法是:不同学历进的公司财务状况基本一致,但是 C 轮的公司可能更倾向于招募本科及本科以上学历的员工。

疑问3:不同的岗位对学历的要求有明显不同吗?

对于这个问题,我绘制了词云。

    首先将数据按照职位类别和学历进行分组并统计频数

    仅保留分组数据的职位类别和学历列

    将新的数据转置

    将职位类别行设置为列名

    利用 pandas 的 to_dict 方法生成词频数据

    利用 wordcloud 的 generate_from_frequencies 方法绘制词频

positionlist_grouped = positionlist.groupby(by = ["secondType","education"],as_index = False).count()
grouped_dz = positionlist_grouped[positionlist_grouped["education"] == "大专"].loc[:,["secondType","positionId"]].T.dropna(axis = 1)
grouped_dz.rename(columns=grouped_dz.loc["secondType",:],inplace = True)
grouped_dz.drop(labels = "secondType",inplace=True)

from wordcloud import WordCloud
wordcloud = WordCloud(font_path="/Library/Fonts/Songti.ttc",background_color="white").generate_from_frequencies(grouped_dz.to_dict("records")[0])
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.show()

上面三张图由左至右分别是专科、本科与硕士学历的职位词云。

可以看到销售相关的工作要求专科学历即可,运营、后端开发、移动前端开发、产品经理等岗位对学历的要求专科、本科平分秋色。而一些当下火热的岗位,比如人工智能、硬件开发、数据开发等,大部分公司对学历的要求是硕士。

疑问4:不同学历的薪资有明显不同吗?

终于,到了最核心也是大家最关心的部分。

原始数据的薪资是一个区间,将区间拆分为最低与最高两个变量。

positionlist["Lsalary"]=positionlist["salary"].str.split("-",expand  = True)[0].str[:-1].astype(int)
positionlist["Hsalary"]=positionlist["salary"].str.split("-",expand  = True)[1].str[:-1].astype(int)

绘制不同学历的最低薪资与最高薪资分布直方图。

x = positionlist[positionlist["education"] == "大专"].loc[:,["Lsalary"]]
y = positionlist[positionlist["education"] == "本科"].loc[:,["Lsalary"]]
z = positionlist[positionlist["education"] == "硕士"].loc[:,["Lsalary"]]
ax = sns.distplot(x)
ax = sns.distplot(y)
ax = sns.distplot(z)
ax.set_xlabel("工资(单位K/月)")
ax.set_title("最低工资分布");
#*****最高薪资           
               
                                           
                       
                 

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/7285.html

相关文章

  • 数据游戏」:数据告诉读书到底赚钱

    摘要:今天,我就用数据告诉你,书中到底有没有黄金屋。数据来源利用的拉勾爬虫爬取了拉勾杭州站,要求年工作经验的条招聘数据。原始数据的薪资是一个区间,将区间拆分为最低与最高两个变量。大专本科硕士工资单位月最低工资分布最高薪资 北起漠河南至曾母暗沙,东达抚远西至斯姆哈纳。在广袤的中国土地上,千百年一直流传着古老的传说:书中自有黄金屋。 今天,我就用数据告诉你,书中到底有没有黄金屋。 数据来源 利用...

    alphahans 评论0 收藏0
  • 云计算的那些事--谈一谈IAAS

    摘要:对于商业市场来说,特别是中国这样一个云计算才刚刚起步的市场。反观云计算售卖的一些商品,目前主要还是以服务器为主。云计算的本质是将计算能力转化为标准化,可售卖的服务。可以说是云计算实践的一个经典案例。有的人会问,云计算厂商需要提供哪些服务。 2015年伊始,国内云计算市场可谓风起云涌。各路群豪纷纷涌入这个市场。其中最活跃的领域当属IAAS。阿里腾讯硝烟未尽,百度重新检讨了自己的PAAS战略后,...

    KitorinZero 评论0 收藏0
  • 段念:永远选择自己想要的

    摘要:华为说应届生招聘已经结束了。我进入华为之后,要定岗,一般大家都愿意去市场部,因为华为最强的是市场部。我非常惊讶,因为为了避免这样的事情,在简历里我只字未提在华为的测试经历。 非商业转载请注明作译者、出处,并保留本文的原始链接:http://www.ituring.com.cn/article/72226 段念,现任豆瓣工程副总裁,曾在Google,乐元互动,OpenTV等公司...

    blastz 评论0 收藏0
  • 《认知突围》做复杂时代的明白人,读书分享

    摘要:认知突围做复杂时代的明白人石志远到底什么才是明白人,处在浪荡岁的我何谈明白。和认知层次不同的人交流,犹如鸡同鸭讲。同一件事情可以做的更快,单位时间内做事情的数量越多,赚取的时间越多。单位时间内做事的经历越多,人生经历越丰富,赚取的时间越多。 《认知突围》做复杂时代的明白人 石志远 到底什么才是明白人,处在20浪荡岁的我何谈明白。 引子 以前,有三个乞丐在城门口要饭,正好踫到皇上出宫狩猎...

    luoyibu 评论0 收藏0
  • 用2014完成2013的梦想

    摘要:以后会持续添加一些总结年,延续着年的野心,打算在考大学之前完成一个成功的项目,但屡屡遭到了挫折。到现在,年,这个项目已经完成了,但是觉得自己是无法在高考前把它发布的了。 showImg(http://segmentfault.com/img/bVbJID); 题图为本文作者作品,未经许可请勿转载并修改发布。另外声明,题图不是本人。 Mark:以后会持续添加一些总结 2013...

    Michael_Lin 评论0 收藏0

发表评论

0条评论

Ryan_Li

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<