北京 [切换城市] 北京招聘

python爬虫工程师

北京中科云智信息技术有限公司

  • 公司规模:150-500人
  • 公司性质:民营公司
  • 公司行业:互联网/电子商务  计算机软件

职位信息

  • 发布日期:2017-06-21
  • 工作地点:北京-海淀区
  • 招聘人数:2人
  • 学历要求:本科
  • 职位月薪:0.8-1.6万/月
  • 职位类别:算法工程师  

职位描述

职位描述:
●岗位职责:
1.负责设计和开发网络爬虫系统,进行多平台信息的抓取和分析工作;
2.负责网页信息和APP数据抽取、清洗、消重等工作,提升平台的抓取效率;
3.参与爬虫核心算法和策略优化,熟悉采集系统的调度策略;
4.实时监控爬虫的进度和警报反馈; 
●技能要求:
1.熟悉Linux系统,掌握Python等语言;
2.掌握网页抓取原理及技术,了解基于Cookie的登录原理,熟悉基于正则表达式、XPath、CSS等网页信息抽取技术;
3.熟悉整个爬虫的设计及实现流程,有从事网络爬虫、网页信息抽取开发经验,熟悉反爬虫技术,有分布式爬虫架构经验;
4.具有数据挖掘、自然语言处理、信息检索、机器学习背景者优先。
5. 熟悉ElasticSearch、Hadoop/Mysql,有多语言开发经验者优先。

职能类别: 算法工程师

举报 分享

公司介绍

北京中科云智信息技术有限公司,简称中科云智,是国内领先的数据分析与信息服务提供商。
    公司自成立以来主要专注于互联网内容采集与分析及信息服务,实现从数据采集、数据挖掘到信息服务的技术产品与解决方案的创新,可以在帮助客户节省运营成本和提升用户体验的同时,创造更多的互联网商业价值,目前已与多家主流内容提供商建立了良好的合作关系。
   中科云智具备多年的数据采集、数据分析、信息服务研发及应用、高性能计算和海量数据处理的成功经验。公司的产品系列包括:
Smarteye;通过自然语言处理和图片分析技术,实现对IDC网络内容的监控与管理。
催缴系统;通过网页右下角弹出的方式,给用户提供更好的催缴信息,为运营商节约了人力成本,同时也增强了用户体验。
Wap数据分析;通过网页正文提取、短文本扩展、文本分类、PLSA聚类等技术,分析手机上网用户日志,从总体上把握数据规律、当前热点、用户偏好等信息。
手机加速器:针对Android和iphone ios手机,分别开发了手机加速器,可以加快用户的上网速度,提高各种应用的下载速度,提升用户体验。
    公司始终把培训工作作为公司发展的重点,随着公司业务的迅速壮大,公司逐步建立和完善了培训体系,建立了以新员工入职培训为主的基础培训,每年还会选派优秀员工参加外部培训、研讨会、商务考察等,全方位的为员工提供一个自我提高的职业成长平台。
    中科云智秉承“客户为先,应用为王“的经营理念,帮助客户在节省运营成本和提高用户体验的同时,与互联网内容提供商(CP)实现共生共赢,为宽带和移动互联网用户带来带来更多的价值。

联系方式

  • 公司地址:上班地址:海淀区蓝靛厂路88号(地铁10号线火器营)