数据采集工程师
中国科学院计算机网络信息中心
- 公司性质:政府机关
- 公司行业:通信/电信/网络设备
职位信息
- 发布日期:2020-03-18
- 工作地点:北京
- 招聘人数:1人
- 工作经验:2年经验
- 学历要求:本科
- 职位月薪:0.6-1.5万/月
- 职位类别:数据库工程师(DBA)
职位描述
岗位职责:
- 负责设计和开发分布式数据采集工具,对目标对象文本、图像等信息采集、分析、统计等;
- 负责数据采集核心算法的设计与开发;
- 根据业务需求优化数据采集策略,保障采集数据产品的稳定性和抓取效率;
任职要求:
- 计算机相关专业本科及以上学历,两年以上数据采集工作经验;
- 熟练掌握Python/Java开发;
- 熟练掌握正则表达式、XPath、CSS等网页信息抽取技术;
- 具有大规模分布式数据采集开发经验,了解反采集机制;
- 熟悉Pyspide、Scrapy、Crawler4j等框架;
- 具有良好的沟通和团队协作能力,良好的学习能力、问题分析和解决能力。
职能类别:数据库工程师(DBA)
关键字:数据采集
公司介绍
中国科学院计算机网络信息中心成立于1995年3月,是中国科学院科研信息化与管理信息化的系统集成、运行和服务保障机构,信息化应用技术的研发和示范基地。1994年4月20日,一条64K的国际专线从计算机网络中心连入Internet,实现了中国与Internet的全功能连接,从此中国成为第77个真正拥有全功能Internet的国家。二十余年来,计算机网络信息中心立足支撑与服务全院科研信息化和管理信息化,汇聚管理信息化资源,发挥了科研应用的信息化、学科交叉开放融合、科学思想传播和科研信息化理念传播的先遣队作用,成为我院信息化基础设施建设、运维和信息化基础服务的一支中坚力量,成为引领中国科研信息化建设和运行服务的一流信息中心。
联系方式
- Email:self@cnic.cn