爬虫工程师
北京友录在线科技发展有限公司
- 公司规模:50-150人
- 公司性质:民营公司
- 公司行业:互联网/电子商务
职位信息
- 发布日期:2014-12-26
- 工作地点:北京-东城区
- 招聘人数:2
- 职位月薪:面议
- 职位类别:数据库工程师/管理员
职位描述
岗位职责:
1、负责互联网相关信息的数据抓取和分析;
2、负责网页信息抽取技术的研究和开发;
3、设计爬取、调度和抽取算法,优化系统;
4、负责抓取数据的深度提取和挖掘。
职位要求:
1、精通网页抓取原理及技术,精通正则表达式,从结构化的和非结构化的数据中获取信息;
2、熟悉linux平台开发,熟悉Python;
3、熟悉搜索引擎和网络爬虫相关技术;
4、熟悉Scrapy等开源爬虫;
5、有一定的数据分析与挖掘经验,有搜索引擎背景或机器学习经验者优先考虑。
1、负责互联网相关信息的数据抓取和分析;
2、负责网页信息抽取技术的研究和开发;
3、设计爬取、调度和抽取算法,优化系统;
4、负责抓取数据的深度提取和挖掘。
职位要求:
1、精通网页抓取原理及技术,精通正则表达式,从结构化的和非结构化的数据中获取信息;
2、熟悉linux平台开发,熟悉Python;
3、熟悉搜索引擎和网络爬虫相关技术;
4、熟悉Scrapy等开源爬虫;
5、有一定的数据分析与挖掘经验,有搜索引擎背景或机器学习经验者优先考虑。
公司介绍
公司是新浪旗下的一家公司,目前主要的产品是微人脉,这也是我们非常重要的一款产品,是基于微博的系列产品,我们为职场人士提供商务社交平台,拓展人脉,发现工作或商业机会,为用户的职业发展提供服务;为企业提供中高端招聘服务,将企业招聘需求和求职者智能匹配和推荐,让企业找到所需人才。