上海 [切换城市] 上海招聘

大数据工程师(网络数据抓取/爬虫技术)

上海伍贤信息技术股份有限公司

  • 公司规模:50-150人
  • 公司性质:外资(欧美)
  • 公司行业:计算机服务(系统、数据服务、维修)

职位信息

  • 发布日期:2019-11-23
  • 工作地点:上海-浦东新区
  • 招聘人数:3人
  • 工作经验:无工作经验
  • 学历要求:招3人
  • 语言要求:不限
  • 职位月薪:1.5-2万/月
  • 职位类别:大数据开发/分析

职位描述

工作职责:

1、负责数据抓取平台规划和建设,完成数据采集与爬取、解析处理和入库;

2、研究各种网页探寻特点和规律,负责网页信息抽取、数据清洗工作;

3、负责领域知识的定向爬取、深度提取和挖掘;

4、配合数据清洗、整理、去重和合并工作;

5、负责爬虫相关技术的创新和优化。


任职资格:


  1. 计算机或相关专业大专以上学历;

(1) 熟练掌握Python爬虫框架Scrapy,要求熟悉Python,同时熟悉Java或Nodejs的优先;

(2) 熟练掌握网页抓取原理及正则表达式、XPath、CSS等网页信息抽取技术;从结构化的和非结构化的数据中获取信息,对网页抓取、信息抽取、去重、清洁、匹配有一定经验;

(3) 熟悉常见的反爬虫机制解决办法;

(4) 掌握移动端APP数据爬虫方法,熟悉常用抓包工具,对APP抓取有一定的经验

(5)具有项目爬虫经验、或数据挖掘相关项目实施经验者优先。

(6)对开源项目有较好的跟踪和关注,如果对一些开源的做海量数据处理的项目如hadoop,spark有经验者会优先考虑。

(7)有数据分析或信息检索开发经验者优先;

职能类别:大数据开发/分析

公司介绍

上海伍贤信息技术股份有限公司(简称WIT),成立于2009年。WIT专注为中高端的国内及海外优质客户提供不同需求的服务解决方案,行业涵盖高端零售,医疗保健,金融保险,电子通信,尖端制造,教育培训等多种领域。

凭借国际化,高水准,专业性的企业面貌,极具灵活创新的内部管理运营方式建立了自主可靠的IT服务品牌及体系,得到众多国内本土及跨国企业的信任与青睐。同时作为上海认证软件生产企业,WIT结合大数据,AI等多种技术,自主研发多套高端商用软件产品,并为各类高端客户定制开发核心企业管理系统,解决行业痛点。

在数年坚持不懈的努力下,WIT于2017年12月底在上海股交中心科创板成功挂牌,股票代码:SEE.300172,成为一家合规、执行和稳健经营的优质企业。我们可以很自豪的说:WIT只为全球优质的客户服务,形成The Best To The Best(强强联手)的战略体系。

联系方式

  • 公司地址:越达巷