爬虫工程师
华住酒店管理有限公司
- 公司规模:10000人以上
- 公司性质:外资(欧美)
- 公司行业:酒店/旅游
职位信息
- 发布日期:2019-06-28
- 工作地点:上海
- 招聘人数:若干人
- 工作经验:5-7年经验
- 学历要求:招若干人
- 语言要求:不限
- 职位月薪:2-3万/月
- 职位类别:大数据开发/分析
职位描述
工作职责:
1. 爬虫系统的架构设计与开发,构建抓取服务平台,完成爬虫数据采集、解析处理、入库等数据工作。
2. 研究和分析目标网站,探索和研究高效的数据抓取解决方案。
3. 反爬虫策略研究,代理IP、验证码识别等采集支撑服务建设,提升网页抓取的效率和质量。
任职资格:
1. 本科及以上学历,3年以上工作经验,对互联网、移动互联网有浓厚的兴趣,喜欢钻研技术。
2. 扎实的数据结构和算法功底,有快速迭代、逐步优化的工程项目经验。
3. 掌握Python/Java/Scala,熟悉目前开源的爬虫框架,如scrapy、webmagic等,深入理解网络爬虫原理,有丰富巨量的数据爬取、解析、清洗、存储相关项目经验。
4. 熟悉多线程、网络编程,精通网页抓取原理及技术,精通正则表达式;能从结构化和非结构化的数据中获取信息,能够抓取App中的数据。
5. 善于独立分析并解决核心问题,如爬虫策略、防屏蔽规则、数据破解策略、App爬取、死链检测、验证码识别技术等。
6. 有自然语言处理,机器学习背景者优先考虑。
7. 具备极强的团队精神和合作精神,对工作有热情,能够在一定压力下工作。
职能类别: 大数据开发/分析
公司介绍
华住酒店集团 (NASDAQ:HTHT),是国内***家多品牌酒店集团,在全国约370座城市,运营3,000多家酒店,并拥有近70,000多名员工。自2005年创立以来,华住始终以专业而高效的智能化管理系统,专注于为客户提供高品质和多元化的住宿和出行体验,成就美好生活。
自2014年,华住酒店集团与雅高酒店集团形成长期战略联盟,共同开辟在华酒店业务。目前,华住运营的酒店品牌已经覆盖所有市场,包含高端市场的美爵、VUE、禧玥,中端市场的诺富特、美居、漫心、全季、桔子水晶、桔子精选、CitiGO、星程、宜必思尚品,以及大众市场的宜必思、汉庭优佳、汉庭、怡莱、海友等知名酒店品牌,满足从商务到休闲的个性化需求。“华住会”,作为华住推出的会员俱乐部,也是一个高效、简单、温情的酒店预订平台,正为全球超过1亿会员提供住宿、出行、购物等服务。
以“成为世界级的伟大企业”为愿景的华住酒店集团,在创始人季琦的带领下,已经成为中国发展最快的酒店集团之一。2010年,华住在美国纳斯达克成功上市。目前,集团位列美国Hotels杂志公布的全球酒店集团排名第9位,旗下汉庭品牌连续四年荣登BrandZ最具价值中国品牌100强。
自2014年,华住酒店集团与雅高酒店集团形成长期战略联盟,共同开辟在华酒店业务。目前,华住运营的酒店品牌已经覆盖所有市场,包含高端市场的美爵、VUE、禧玥,中端市场的诺富特、美居、漫心、全季、桔子水晶、桔子精选、CitiGO、星程、宜必思尚品,以及大众市场的宜必思、汉庭优佳、汉庭、怡莱、海友等知名酒店品牌,满足从商务到休闲的个性化需求。“华住会”,作为华住推出的会员俱乐部,也是一个高效、简单、温情的酒店预订平台,正为全球超过1亿会员提供住宿、出行、购物等服务。
以“成为世界级的伟大企业”为愿景的华住酒店集团,在创始人季琦的带领下,已经成为中国发展最快的酒店集团之一。2010年,华住在美国纳斯达克成功上市。目前,集团位列美国Hotels杂志公布的全球酒店集团排名第9位,旗下汉庭品牌连续四年荣登BrandZ最具价值中国品牌100强。
联系方式
- Email:yinlzhang@huazhu.com
- 公司地址:北京