高级爬虫开发工程师
北京铭万互联科技有限公司
- 公司规模:1000-5000人
- 公司性质:民营公司
- 公司行业:互联网/电子商务
职位信息
- 发布日期:2012-08-08
- 工作地点:北京
- 招聘人数:若干
- 学历要求:大专
- 职位类别:高级软件工程师
职位描述
岗位描述:
1.负责爬虫技术架构的规划,参与爬虫各子系统的设计与编码工作;
2.通过研究策略和各种算法,深入的数据挖掘,不断提升爬虫系统的效果;
3.分析数据,找出系统技术缺陷,优化架构和策略,以达成相关技术指标;
4.解析网页,提取网页特征,提高各种特征的准确率和召回率;
5.研究和实现页面去重的相关算法,不断提高算法的效果与效率;
6.爬虫各子系统的数据分析和日常运维工作。
任职要求:
1.正规大学本科及以上学历;3年以上实际工作经验;
2.熟练掌握c/c++语言;熟悉掌握各种数据结构和算法,能够在linux/unix下进行开发;
3.熟悉多线程/多进程开发,网络编程;
4.熟悉搜索引擎技术,云计算平台;
5.有钻研精神,责任心强, 良好的团队合作精神和较好的沟通协调能力;
6.熟悉python,php者优先;
7.有数据爬取、网页解析、数据挖掘等相关经验者优先。
1.负责爬虫技术架构的规划,参与爬虫各子系统的设计与编码工作;
2.通过研究策略和各种算法,深入的数据挖掘,不断提升爬虫系统的效果;
3.分析数据,找出系统技术缺陷,优化架构和策略,以达成相关技术指标;
4.解析网页,提取网页特征,提高各种特征的准确率和召回率;
5.研究和实现页面去重的相关算法,不断提高算法的效果与效率;
6.爬虫各子系统的数据分析和日常运维工作。
任职要求:
1.正规大学本科及以上学历;3年以上实际工作经验;
2.熟练掌握c/c++语言;熟悉掌握各种数据结构和算法,能够在linux/unix下进行开发;
3.熟悉多线程/多进程开发,网络编程;
4.熟悉搜索引擎技术,云计算平台;
5.有钻研精神,责任心强, 良好的团队合作精神和较好的沟通协调能力;
6.熟悉python,php者优先;
7.有数据爬取、网页解析、数据挖掘等相关经验者优先。
公司介绍
北京铭万互联科技有限公司诚聘
联系方式
- 公司地址:上班地址:东方新世界中心1610