东莞 [切换城市] 东莞招聘

爬虫工程师

华住酒店管理有限公司

  • 公司规模:10000人以上
  • 公司性质:外资(欧美)
  • 公司行业:酒店/旅游

职位信息

  • 发布日期:2019-06-28
  • 工作地点:上海
  • 招聘人数:若干人
  • 工作经验:5-7年经验
  • 学历要求:招若干人
  • 语言要求:不限
  • 职位月薪:2-3万/月
  • 职位类别:大数据开发/分析

职位描述

工作职责:

1. 爬虫系统的架构设计与开发,构建抓取服务平台,完成爬虫数据采集、解析处理、入库等数据工作。

2. 研究和分析目标网站,探索和研究高效的数据抓取解决方案。

3. 反爬虫策略研究,代理IP、验证码识别等采集支撑服务建设,提升网页抓取的效率和质量。

任职资格:

1. 本科及以上学历,3年以上工作经验,对互联网、移动互联网有浓厚的兴趣,喜欢钻研技术。

2. 扎实的数据结构和算法功底,有快速迭代、逐步优化的工程项目经验。

3. 掌握Python/Java/Scala,熟悉目前开源的爬虫框架,如scrapy、webmagic等,深入理解网络爬虫原理,有丰富巨量的数据爬取、解析、清洗、存储相关项目经验。

4. 熟悉多线程、网络编程,精通网页抓取原理及技术,精通正则表达式;能从结构化和非结构化的数据中获取信息,能够抓取App中的数据。

5. 善于独立分析并解决核心问题,如爬虫策略、防屏蔽规则、数据破解策略、App爬取、死链检测、验证码识别技术等。

6. 有自然语言处理,机器学习背景者优先考虑。

7. 具备极强的团队精神和合作精神,对工作有热情,能够在一定压力下工作。

职能类别: 大数据开发/分析

公司介绍

华住酒店集团 (NASDAQ:HTHT),是国内***家多品牌酒店集团,在全国约370座城市,运营3,000多家酒店,并拥有近70,000多名员工。自2005年创立以来,华住始终以专业而高效的智能化管理系统,专注于为客户提供高品质和多元化的住宿和出行体验,成就美好生活。
自2014年,华住酒店集团与雅高酒店集团形成长期战略联盟,共同开辟在华酒店业务。目前,华住运营的酒店品牌已经覆盖所有市场,包含高端市场的美爵、VUE、禧玥,中端市场的诺富特、美居、漫心、全季、桔子水晶、桔子精选、CitiGO、星程、宜必思尚品,以及大众市场的宜必思、汉庭优佳、汉庭、怡莱、海友等知名酒店品牌,满足从商务到休闲的个性化需求。“华住会”,作为华住推出的会员俱乐部,也是一个高效、简单、温情的酒店预订平台,正为全球超过1亿会员提供住宿、出行、购物等服务。
以“成为世界级的伟大企业”为愿景的华住酒店集团,在创始人季琦的带领下,已经成为中国发展最快的酒店集团之一。2010年,华住在美国纳斯达克成功上市。目前,集团位列美国Hotels杂志公布的全球酒店集团排名第9位,旗下汉庭品牌连续四年荣登BrandZ最具价值中国品牌100强。

联系方式

  • Email:yinlzhang@huazhu.com
  • 公司地址:北京