网络百姓生活网门户

关于招聘和互联网求职,你想知道的都在这!| 好作品

镝次元数据传媒实验室2019-06-20 03:13:21


文/张玉涵  版面/胡曼君


镝摘

求职招聘一直都是大家津津乐道的话题,每到春秋校招季更为明显,毕竟工作关系到每月的“口粮”,了解行情很重要。那么,2017年秋季招聘中竞争最激烈的行业是什么?不同行业不同城市,应届生的工资水平怎么样?在互联网行业,学历有多值钱呢?这些关乎切身利益的话题,我们跟随澎湃美数课的两篇系列数据新闻一起来看看吧!


关于求职,你最关心的问题是什么?工资、城市、还是职业要求?这些因素在每个人心中排序可能不太一样,但不可否认都非常重要。在澎湃美数课栏目中《热门又高薪的岗位都要求什么?4万份招聘告诉你》《互联网行业哪些岗位越老越吃香?8万份招聘告诉你》用大量数据为我们刻画了招聘市场的整体情况。俗话说,“知己知彼,才能百战不殆”,在了解自己的特点和优势之外,熟悉求职市场变化也非常重要。



01

递进式逻辑更吸引观众


虽然求职话题能抓取不少读者的眼球,但是如何去表现这个话题呢?澎湃美数课用了秋招季系列文章的形式,层层递进来展现。首先是第一篇告诉大家,2017年秋季求职十大最热门行业、不同行业不同城市应届生工资水平、五大热门行业的招聘要求,这些是求职需要了解的一般信息。



第二篇把视角聚焦到最热门的互联网行业,展示了互联网行业不同城市的额薪资,各类型企业平均工资、学历要求的岗位工资分布、不同工作经验不同工作岗位的月薪分布、不同岗位的技能要求。



这样每篇文章的主题突出,思路清晰,让不同阅读需求的用户都能找到自己感兴趣的话题。关于选择系列报道的形式,澎湃新闻数据编辑张轩婷,也是报道的作者这样说道,“在一个比较长的时间内看,具有社会意义、且可复用的选题会较大可能选择系列形式。当然优缺点也存在,优点是比较深入,缺点是战线比较长,没有热点的加成。


02

抓取数据让讲故事的空间更大


关于秋招话题,智联招聘也发布了相关的大数据报告,但在澎湃这两篇数据新闻中并没有直接引用报告上的数据,而是主动抓取了相关数据。第一篇中,抓取了十个行业中、在19个城市(北上广深及新一线城市)且检索关键词为:全职、无经验要求以及大专学历以上的43486份工作招聘说明。第二篇抓取了今年8月1日至11月10日之间,智联招聘平台上发布的86451个互联网行业的岗位招聘信息(工作地点在北京、上海、深圳、广州、杭州以及成都这六所城市)。



为什么会选择抓取数据来呈现内容呢?澎湃新闻数据编辑张轩婷这样回答,“报告提供的信息始终是第二手的内容,是报告撰写者的观察和总结,商业报告的服务对象与新闻媒体肯定也存在一定差异。因此抓取数据也是为了从更多角度来发现故事,优势是有完整的数据集,讲故事的空间会更大。


但是另一方面,这样操作也会多花不少时间和精力,两篇数据新闻前后大约需要一个月的时间,除了更耗时,张轩婷说到,“自己抓取的数据还要必须有足够的精确性,因为没有其他机构可以为数据的可信度背书。


03

数据新闻记者的全能型转变


大家都知道数据新闻的完成很难靠一个记者“单打独斗”完成,因为它不仅涉及到选题策划、文字撰写,还有数据处理、可视化设计等过程,这也预示着数据新闻的记者将越来越向全能型转型。

 

在澎湃美数课的这两篇报道中,虽然数据量、任务量众多,但主要是由一个人完成的,团队其他成员会给出设计或编辑意见。作者张轩婷说道,“数据的抓取使用了Python,而且由文字记者完成。”当然抓取过程中也会遇到一些困难,“一是招聘网站的抓取限制,做了一些伪装和减低了抓取频次二是抓取范围的不好确定,因为文章的思路前后会有一些修改,会影响抓取范围,比如说某些城市要不要加入,某些维度要不要一些抓取下来,重复抓了很多次。



除了数据抓取,清洗也是非常必须的,那么技术层面上主要是以下过程,“1.在pandas中把同一类别的招聘要求文字合在一起2.然后使用jieba分词3.使用wordcloud进行可视化。(以上都是python的包)。”

 

可见,对于数据新闻记者来说,找选题策划思路只是一项基本功,进行数据处理和可视化设计的技能同样必不可少。非常感谢澎湃给大家带来这么优秀的数据新闻作品,也希望以后有更多精彩的呈现!


特别感谢:澎湃新闻数据编辑 张轩婷