东莞 [切换城市] 东莞招聘东莞互联网/电子商务/网游招聘东莞互联网软件开发工程师招聘

Python高级爬虫工程师

深圳市啦啦配送有限公司

  • 公司规模:1000-5000人
  • 公司性质:民营公司
  • 公司行业:汽车

职位信息

  • 发布日期:2019-11-11
  • 工作地点:深圳-福田区
  • 招聘人数:若干人
  • 工作经验:3-4年经验
  • 学历要求:大专
  • 职位月薪:1.5-2万/月
  • 职位类别:互联网软件开发工程师

职位描述


1. 负责分布式网络爬虫系统的架构设计与开发;参与系统设计与开发;

2. 手机APP、互联网站、网页、链接的特征挖掘,进行网页抓取、数据提取、清洗、入库;

3. 负责爬虫核心算法的策略优化研究,充分利用资源,避免限制;

4. 优化搜索、匹配、抓取等关键程序的性能及效率;

5. 进行技术分享与培训;

6. 负责公司网页外挂机器人开发及维护

任职要求:

1. 3年以上爬虫开发相关经验,熟练使用Python或Java进行开发;

2. 熟悉反爬技术技术,图片识别码,滑动块识验码等技术

3. 熟悉手机APP抓取优先

4. 熟练使用正则表达式、css path、xpath等,能够从结构化的和非结构化的数据中获取信息;

5. 熟练使用MySQL数据库,掌握redis、mongodb、hive等常用nosql技术并具有实战经验;

6. 精通一种开源爬虫框架,如scrapy、webmagic、nutch、heritrix等,有开发爬虫框架经验优先;

7. 具有数据挖掘、自然语言处理、信息检索、机器学习背景者优先;

8. 同时精通Python与Java者优先;

公司介绍

货拉拉业务范围已覆盖350+座中国大陆城市,中国港台及东南亚14座城市,已成为国内同城货运平台的领军企业。啦啦配送现为货拉拉旗下致力于汽车销售和服务的子公司。针对广大司机朋友的购车需求,提供相应的销售,保险,上牌,验车,年检,交车,理赔等一条龙服务.

联系方式

  • 公司地址:地址:span厦滘村启梦创业广场1层1B163