爬虫开发工程师
深圳尊豪网络科技股份有限公司
- 公司规模:150-500人
- 公司性质:民营公司
- 公司行业:互联网/电子商务
职位信息
- 发布日期:2019-03-23
- 工作地点:深圳-南山区
- 招聘人数:1人
- 工作经验:3-4年经验
- 学历要求:大专
- 职位月薪:0.8-1.4万/月
- 职位类别:软件工程师
职位描述
职位信息:
1、负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析工作;
2、负责网页信息和APP数据抽取、清洗、消重等工作,提升平台的抓取效率;
3、实时监控爬虫的进度和警报反馈;
4、抓取策略算法的更新维护,以及确保数据抽取准确、高效;
5、对抓取的网页进行模块分析以及数据抽取还原。
任职要求:
1、3年以上的爬虫经验,有扎实的算法和数据结构能力,具备强悍的编码能力;
2、熟悉爬虫原理,熟悉常见的反爬虫技术,有爬虫相关项目开发经验者优先;
3、熟悉tcp,http协议原理;熟悉ajax工作原理;精通Python编程,至少熟悉一种开源爬虫框架和源码;
4、掌握http协议,熟悉html、dom、xpath等常见的数据抽取技术;
5、熟悉html标签,html模块解析、拆分、样式还原等;
6、熟悉html样式,js脚本,js渲染。
备注:本岗位需要对html分模块解析,根据url实时解析文章内容并返回,需具备较强的模块拆解、网页解析后样式还原等能力。普通的网页爬取、反爬取、存储不合适。
职能类别: 软件工程师
公司介绍
深圳市尊豪网络科技股份有限公司是国内知名的房地产服务移动互联网企业,成立于2007年,总部位于深圳市南山区软件产业基地,隶属高新技术企业、软件企业。公司始终秉承“连接一切 ? 连接人与企业服务价值的互联网公司”,独家连接腾讯云、腾讯街景地图、腾讯网、腾讯新闻、微信、QQ等腾讯核心资源,专业为国内300多家房地产开发集团提供近4000个楼盘项目的“互联网+”服务。
http://www.szzunhao.com/
http://www.szzunhao.com/
联系方式
- 公司地址:地址:span粤海街道深圳湾创业投资大厦14层