爬虫工程师
北京万创聚力科技有限公司
- 公司规模:50-150人
- 公司性质:民营公司
- 公司行业:互联网/电子商务 计算机软件
职位信息
- 发布日期:2017-08-07
- 工作地点:北京
- 招聘人数:1人
- 工作经验:2年经验
- 学历要求:本科
- 职位月薪:1-2万/月
- 职位类别:软件工程师
职位描述
职位描述:
岗位描述
1、参与数据层建设,专注于基础数据采集平台建设,垂直领域数据爬取,进行多平台信息的抓取和分析;
2、负责设计和开发分布式网络爬虫系统,参与数据爬取平台相关工具平台的架构设计与产品开发等工作;
岗位要求
1.熟悉Linux系统,掌握Java 、Python、C++等语言;
2.了解多线程、多进程、网络通信编程相关知识,有分布式爬虫架构,数据挖掘经验;
3.掌握网页抓取原理及技术,了解基于Cookie的登录原理,熟悉基于正则表达式、XPath、CSS等网页信息抽取技术;
4、做过数据处理、ETL等相关工作优先。
5、对网络层协议及网络技术熟悉者优先考虑;
举报
分享
岗位描述
1、参与数据层建设,专注于基础数据采集平台建设,垂直领域数据爬取,进行多平台信息的抓取和分析;
2、负责设计和开发分布式网络爬虫系统,参与数据爬取平台相关工具平台的架构设计与产品开发等工作;
岗位要求
1.熟悉Linux系统,掌握Java 、Python、C++等语言;
2.了解多线程、多进程、网络通信编程相关知识,有分布式爬虫架构,数据挖掘经验;
3.掌握网页抓取原理及技术,了解基于Cookie的登录原理,熟悉基于正则表达式、XPath、CSS等网页信息抽取技术;
4、做过数据处理、ETL等相关工作优先。
5、对网络层协议及网络技术熟悉者优先考虑;
职能类别: 软件工程师
公司介绍
北京万创聚力科技有限公司是南威软件股份公司(股票代码603636)投资的一家互联网公司,专注于建设和运营万众创新公共服务平台( www.innochina.com,以下简称“万创中国”)。
(使命)“万创中国”是“互联网+”新经济业态下服务于创新创造的众智,众创,众包,众享开放平台。它汇聚万众创新全要素资源,联接产品创意、设计、制造、交易全生命周期,满足消费者参与产品设计的个性化定制、柔性化制造需求。平台推出的“找空间,找人才,找工具,找服务,找项目,找资金,找交易”等7大类服务,将力促需求和实现之间精准匹配、快速对接,极大地降低创客创新创造的风险、门槛和成本,提升创新创造的效率和成功率。
(愿景)我们将致力于把 “万创中国”建设成为支撑“万众创新”的互联网开放平台,使之成为全民创新创造不可或缺的基础设施之一,让“创新之引擎,创客之乐园”成为“万创中国”的代名词。
(使命)“万创中国”是“互联网+”新经济业态下服务于创新创造的众智,众创,众包,众享开放平台。它汇聚万众创新全要素资源,联接产品创意、设计、制造、交易全生命周期,满足消费者参与产品设计的个性化定制、柔性化制造需求。平台推出的“找空间,找人才,找工具,找服务,找项目,找资金,找交易”等7大类服务,将力促需求和实现之间精准匹配、快速对接,极大地降低创客创新创造的风险、门槛和成本,提升创新创造的效率和成功率。
(愿景)我们将致力于把 “万创中国”建设成为支撑“万众创新”的互联网开放平台,使之成为全民创新创造不可或缺的基础设施之一,让“创新之引擎,创客之乐园”成为“万创中国”的代名词。
联系方式
- 公司地址:上班地址:北京市石景山区鲁谷路74号中国瑞达大厦16层