高级java爬虫工程师
北京万朝科技有限公司
- 公司规模:150-500人
- 公司性质:民营公司
- 公司行业:专业服务(咨询、人力资源、财会)
职位信息
- 发布日期:2017-03-29
- 工作地点:北京-朝阳区
- 招聘人数:1人
- 工作经验:3-4年经验
- 职位月薪:1.5-2.5万/月
- 职位类别:软件工程师
职位描述
职位描述:
岗位职责:
1. 对指定的多个网站进行网页抓取、数据提取;破解反爬策略;
2. 负责网页信息抽取、数据清洗等研发和优化工作;
岗位要求:
1.3年以上JAVA开发经验;
2. 熟悉网页抓取原理及技术,了解基于Cookie的登录原理,熟悉基于正则表达式、Jsoup、XPath、CSS等网页信息抽取技术;
3. 熟悉反爬虫技术经验优先;
4. 熟悉Mysql/Hadoop/Hbase等基础存储,设计高效的存储方式。
5. 对数据敏感,做过数据处理、ETL等相关工作者优先。
6.有大数据处理经验优先
举报
分享
岗位职责:
1. 对指定的多个网站进行网页抓取、数据提取;破解反爬策略;
2. 负责网页信息抽取、数据清洗等研发和优化工作;
岗位要求:
1.3年以上JAVA开发经验;
2. 熟悉网页抓取原理及技术,了解基于Cookie的登录原理,熟悉基于正则表达式、Jsoup、XPath、CSS等网页信息抽取技术;
3. 熟悉反爬虫技术经验优先;
4. 熟悉Mysql/Hadoop/Hbase等基础存储,设计高效的存储方式。
5. 对数据敏感,做过数据处理、ETL等相关工作者优先。
6.有大数据处理经验优先
职能类别: 软件工程师
公司介绍
万朝是一个品牌,是一家具有自主软件开发、审计、税务、咨询、培训等各种服务资质的综合性公司,万朝以提供优质服务为己任,关注客户的需求和挑战。万朝致力于持续获得专业知识以转化为客户价值,帮助客户提升企业内外部管理、提高企业工作效率、提高竞争力,使客户、投资者及利益相关者获益。万朝集团下设有北京万朝科技有限公司、万朝财务咨询(北京)有限公司、万朝会计(税务)师事务所。
北京万朝科技有限公司坐落在北京市朝阳区西大望路3号蓝堡国际中心2座15层,是一家成立于2010年9月份的高科技公司。目前,已在深圳、杭州、成都、武汉成立了分公司,业务范围覆盖了全国各大中城市。我们坚信:软件改变世界,万朝改变您的未来!
万朝集团拥有一个强大的管理和技术精英团队。他们年富力强、有多年IT服务的工作经历,在业界有较高的知名度与影响力,同时公司还有一批各方面的专家,随时随地为高科技企业发展保驾护航。
万朝科技面向企业用户,提供先进的人性化的软件工具和技术服务,并进行相关的技术推广、财务咨询和投资顾问等。
万朝科技的产品有:项目管理、人力资源管理、呼叫中心管理系统、CRM系统、本地及异地工作效率管理系统、组织内部通信系统、协同管理系统、会计系统与财务管理系统、项目开发、相关硬件产品的开发和销售。
与企业同呼吸共命运是我们万朝不变的宗旨!
欢迎有激情有志向的优秀人才加入万朝,一起倾力打造万朝品牌,共同奋斗共享成功!
北京万朝科技有限公司坐落在北京市朝阳区西大望路3号蓝堡国际中心2座15层,是一家成立于2010年9月份的高科技公司。目前,已在深圳、杭州、成都、武汉成立了分公司,业务范围覆盖了全国各大中城市。我们坚信:软件改变世界,万朝改变您的未来!
万朝集团拥有一个强大的管理和技术精英团队。他们年富力强、有多年IT服务的工作经历,在业界有较高的知名度与影响力,同时公司还有一批各方面的专家,随时随地为高科技企业发展保驾护航。
万朝科技面向企业用户,提供先进的人性化的软件工具和技术服务,并进行相关的技术推广、财务咨询和投资顾问等。
万朝科技的产品有:项目管理、人力资源管理、呼叫中心管理系统、CRM系统、本地及异地工作效率管理系统、组织内部通信系统、协同管理系统、会计系统与财务管理系统、项目开发、相关硬件产品的开发和销售。
与企业同呼吸共命运是我们万朝不变的宗旨!
欢迎有激情有志向的优秀人才加入万朝,一起倾力打造万朝品牌,共同奋斗共享成功!