深圳 [切换城市] 深圳招聘深圳计算机软件招聘深圳高级软件工程师招聘

高级爬虫工程师G00525

浙江集享电子商务有限公司

  • 公司规模:1000-5000人
  • 公司性质:民营公司
  • 公司行业:互联网/电子商务

职位信息

  • 发布日期:2019-08-06
  • 工作地点:深圳-宝安区
  • 招聘人数:1人
  • 工作经验:3-4年经验
  • 学历要求:本科
  • 职位月薪:1.5-3万/月
  • 职位类别:高级软件工程师

职位描述

岗位职责:

1、负责设计、开发、维护分布式的网络爬虫,包括调度、抓取、维护、验证等爬虫工作

2、负责定向数据的采集与爬取、解析处理、入库及备份等数据日常工作;

3、负责抽取算法和数据库建模的调研和设计,保证抽取、去重、分类、解析、增量融合入库等流程之后的数据结果;


岗位要求:

1、3年以上Linux环境Java/Python/golang开发经验,至少2年以上爬虫系统开发经验;

2、使用技术框架包括但不限于:Nutch,WebCollector,Scrapy,Selenium,webmagic

3、熟练使用正则表达式、xpath解析数据、搜索策略、算法、数据聚类、重组技术,熟悉反爬虫;

4、对反爬机制有研究,有过海量代理IP池建设,复杂验证码识别,破解复杂图片验证码/账号限制经验者优先

5、熟悉抓包工具(Wireshark,Fillder等),熟悉网络通信编程,网页抓取原理及技术,熟悉HTTP传输协议,能模拟各类操作爬虫;熟悉爬虫实现原理机制;对分布式和多线程技术有一定了解;

6、熟练掌握分布式爬虫,日采集量千万级别以上,并充分了解抓取策略(1、深度优先遍历策略 2、宽度优先遍历策略 3、反向链接数策略等);

7、有较强的学习能力,对技术有钻研精神,热衷于新技术的学习和实践;

8、具有良好的团队协作精神,思维清晰敏捷,逻辑分析能力强。

职能类别: 高级软件工程师

公司介绍

云集是一家由社交驱动的精品会员电商,为会员提供美妆个护、手机数码、母
婴玩具、水果生鲜等全品类精选商品。
云集致力于通过“精选”供应链策略以及极具社交属性的“爆款”营销策略,
聚焦商品的极致性价比,帮助亿万消费者以“批发价”买到全球好货。
2017年云集通过4000多款精选商品,完成同比增速超400%的业绩。
2018年4月23日,云集宣布完成1.2亿美元B轮融资,成为行业独角兽企业。
2019年5月3日,云集正式在美国纳斯达克挂牌上市。

联系方式

  • 公司地址:地址:span杭州湾信息港F座17F