数据爬虫工程师
合肥企业经营者人才公司
- 公司规模:1000-5000人
- 公司性质:事业单位
- 公司行业:专业服务(咨询、人力资源、财会)
职位信息
- 发布日期:2017-12-03
- 工作地点:北京-朝阳区
- 工作经验:无工作经验
- 职位月薪:1.2-1.6万/月
- 职位类别:软件工程师 高级软件工程师
职位描述
职位描述:
岗位职责:
1.编写爬虫实现对互联网网站、网页内容的爬取、采集和数据抽取等工作;
2.内容提取、处理、结构化、过滤等数据处理,并设计存储结构;
3.搭建通用爬虫框架,支持各种定制化爬虫需求的快速实现;
4.攻关抓取过程中的关键技术,优化代理,调度,解析,数据处理等核心模块。
岗位要求:
1.计算机相关专业统招本科及以上学历;
2.精通python或Java语言,3年以上项目开发经验优先;
3.熟悉scrapy,pyspider, nutch,Heritrix或其他爬虫框架;
4.有较多的web站点爬取、开发经验;
5.熟悉网页抓取原理及技术,熟悉基于Cookie的网站登录原理,熟悉基于正则表达式、Xpath、CSS、DOM模型等网页信息抽取技术。
联系方式:18201000667(微信同号)董先生
简历邮箱:2529520236@qq.com
岗位职责:
1.编写爬虫实现对互联网网站、网页内容的爬取、采集和数据抽取等工作;
2.内容提取、处理、结构化、过滤等数据处理,并设计存储结构;
3.搭建通用爬虫框架,支持各种定制化爬虫需求的快速实现;
4.攻关抓取过程中的关键技术,优化代理,调度,解析,数据处理等核心模块。
岗位要求:
1.计算机相关专业统招本科及以上学历;
2.精通python或Java语言,3年以上项目开发经验优先;
3.熟悉scrapy,pyspider, nutch,Heritrix或其他爬虫框架;
4.有较多的web站点爬取、开发经验;
5.熟悉网页抓取原理及技术,熟悉基于Cookie的网站登录原理,熟悉基于正则表达式、Xpath、CSS、DOM模型等网页信息抽取技术。
联系方式:18201000667(微信同号)董先生
简历邮箱:2529520236@qq.com
职能类别: 软件工程师 高级软件工程师
公司介绍
作为领先的整体人才解决方案服务商,中国首家登陆A股的人力资源服务企业,公司在中国大陆、香港、印度、新加坡、马来西亚、美国等全球市场拥有79家分支机构,1,500余名专业招聘顾问,在超过18个行业及领域为客户提供中高端人才访寻、招聘流程外包、灵活用工、招聘培训等解决方案。在1996年至2017年,我们已与2,000余家跨国集团、国内上市公司、快速成长性企业及非盈利组织建立长期合作关系。在过去的一年中,成功为企业推荐的中高级管理及专业技术职位超过15,000名,全风险灵活用工超过60,000人次。
联系方式
- Email:2529520236@qq.com
- 公司地址:上班地址:北京市西城区西直门外大街112号阳光大厦7层