高级爬虫工程师
北京艾漫智汇科技有限公司
- 公司规模:少于50人
- 公司性质:民营公司
- 公司行业:计算机软件 互联网/电子商务
职位信息
- 发布日期:2015-07-04
- 工作地点:北京-朝阳区
- 招聘人数:1
- 工作经验:3-4年
- 学历要求:本科
- 职位月薪:面议
- 职位类别:互联网软件开发工程师 高级软件工程师
职位描述
岗位职责:
1.对指定的多个网站的网页进行网页抓取、数据的提取、清洗、入库;
2.对匹配、同步等后台守护程序进行性能优化等;
3.负责特殊网页采集任务的分析及采集方案设计。
岗位要求:
1.两年以上JAVA开发经验, 熟悉多线程、多进程、网络通信编程相关知识;
2.精通网页抓取原理及技术,精通正则表达式,从结构化的和非结构化的数据中获取信息;
3.能够总结分析不同网站,网页的结构特点及规律;
4.有分布式爬虫架构经验优先;
5.有新闻/垂直领域爬虫开发经验优先。
1.对指定的多个网站的网页进行网页抓取、数据的提取、清洗、入库;
2.对匹配、同步等后台守护程序进行性能优化等;
3.负责特殊网页采集任务的分析及采集方案设计。
岗位要求:
1.两年以上JAVA开发经验, 熟悉多线程、多进程、网络通信编程相关知识;
2.精通网页抓取原理及技术,精通正则表达式,从结构化的和非结构化的数据中获取信息;
3.能够总结分析不同网站,网页的结构特点及规律;
4.有分布式爬虫架构经验优先;
5.有新闻/垂直领域爬虫开发经验优先。
公司介绍
北京艾漫智汇科技有限公司(iMiner.com)是一家专注在互联网信息智能挖掘领域的高科技公司,致力于将数据转化为智慧,提供公正精准的数据分析服务和随需应变的商业智能服务。
我们相信智慧源于数据,我们的使命是智慧改变生活 。
“想你所需”——通过构建海量信息智能挖掘的开放云平台,对互联网信息进行抓取、分析和聚合,智能挖掘各种潜在的信息对象和关系,进行基于海量数据的全局分析、关联分析和趋势预测,为用户提供随时随地的接入服务,满足用户个性化的信息需求,为企业提升商业智能。
艾漫拥有雄厚的技术实力和背景,核心技术团队来自清华大学,在人工智能、自然语言处理、数据挖掘等领域有长期积累,以及在算法设计、大规模数据处理、互联网运营等方面具备丰富经验。
我们将努力成为互联网信息智能挖掘领域的领先品牌 !
我们相信智慧源于数据,我们的使命是智慧改变生活 。
“想你所需”——通过构建海量信息智能挖掘的开放云平台,对互联网信息进行抓取、分析和聚合,智能挖掘各种潜在的信息对象和关系,进行基于海量数据的全局分析、关联分析和趋势预测,为用户提供随时随地的接入服务,满足用户个性化的信息需求,为企业提升商业智能。
艾漫拥有雄厚的技术实力和背景,核心技术团队来自清华大学,在人工智能、自然语言处理、数据挖掘等领域有长期积累,以及在算法设计、大规模数据处理、互联网运营等方面具备丰富经验。
我们将努力成为互联网信息智能挖掘领域的领先品牌 !