Python高级爬虫工程师
深圳市啦啦配送有限公司
- 公司规模:1000-5000人
- 公司性质:民营公司
- 公司行业:汽车
职位信息
- 发布日期:2019-11-11
- 工作地点:深圳-福田区
- 招聘人数:若干人
- 工作经验:3-4年经验
- 学历要求:大专
- 职位月薪:1.5-2万/月
- 职位类别:互联网软件开发工程师
职位描述
1. 负责分布式网络爬虫系统的架构设计与开发;参与系统设计与开发;
2. 手机APP、互联网站、网页、链接的特征挖掘,进行网页抓取、数据提取、清洗、入库;
3. 负责爬虫核心算法的策略优化研究,充分利用资源,避免限制;
4. 优化搜索、匹配、抓取等关键程序的性能及效率;
5. 进行技术分享与培训;
6. 负责公司网页外挂机器人开发及维护
任职要求:
1. 3年以上爬虫开发相关经验,熟练使用Python或Java进行开发;
2. 熟悉反爬技术技术,图片识别码,滑动块识验码等技术
3. 熟悉手机APP抓取优先
4. 熟练使用正则表达式、css path、xpath等,能够从结构化的和非结构化的数据中获取信息;
5. 熟练使用MySQL数据库,掌握redis、mongodb、hive等常用nosql技术并具有实战经验;
6. 精通一种开源爬虫框架,如scrapy、webmagic、nutch、heritrix等,有开发爬虫框架经验优先;
7. 具有数据挖掘、自然语言处理、信息检索、机器学习背景者优先;
8. 同时精通Python与Java者优先;
职能类别:互联网软件开发工程师
公司介绍
货拉拉业务范围已覆盖350+座中国大陆城市,中国港台及东南亚14座城市,已成为国内同城货运平台的领军企业。啦啦配送现为货拉拉旗下致力于汽车销售和服务的子公司。针对广大司机朋友的购车需求,提供相应的销售,保险,上牌,验车,年检,交车,理赔等一条龙服务.
联系方式
- 公司地址:地址:span厦滘村启梦创业广场1层1B163