南京 [切换城市] 南京招聘

数据采集工程师

中国科学院计算机网络信息中心

  • 公司性质:政府机关
  • 公司行业:通信/电信/网络设备

职位信息

  • 发布日期:2020-03-18
  • 工作地点:北京
  • 招聘人数:1人
  • 工作经验:2年经验
  • 学历要求:本科
  • 职位月薪:0.6-1.5万/月
  • 职位类别:数据库工程师(DBA)

职位描述

岗位职责:

  1. 负责设计和开发分布式数据采集工具,对目标对象文本、图像等信息采集、分析、统计等;
  2. 负责数据采集核心算法的设计与开发;
  3. 根据业务需求优化数据采集策略,保障采集数据产品的稳定性和抓取效率; 


任职要求:

  1. 计算机相关专业本科及以上学历,两年以上数据采集工作经验;
  2. 熟练掌握Python/Java开发;
  3. 熟练掌握正则表达式、XPathCSS等网页信息抽取技术;
  4. 具有大规模分布式数据采集开发经验,了解反采集机制;
  5. 熟悉PyspideScrapyCrawler4j等框架;
  6. 具有良好的沟通和团队协作能力,良好的学习能力、问题分析和解决能力。

职能类别:数据库工程师(DBA)

关键字:数据采集

公司介绍

  中国科学院计算机网络信息中心成立于1995年3月,是中国科学院科研信息化与管理信息化的系统集成、运行和服务保障机构,信息化应用技术的研发和示范基地。1994年4月20日,一条64K的国际专线从计算机网络中心连入Internet,实现了中国与Internet的全功能连接,从此中国成为第77个真正拥有全功能Internet的国家。二十余年来,计算机网络信息中心立足支撑与服务全院科研信息化和管理信息化,汇聚管理信息化资源,发挥了科研应用的信息化、学科交叉开放融合、科学思想传播和科研信息化理念传播的先遣队作用,成为我院信息化基础设施建设、运维和信息化基础服务的一支中坚力量,成为引领中国科研信息化建设和运行服务的一流信息中心。

联系方式

  • Email:self@cnic.cn