网络爬虫研发工程师
北京畅思伟业信息咨询中心
- 公司规模:少于50人
- 公司性质:民营公司
- 公司行业:专业服务(咨询、人力资源、财会)
职位信息
- 发布日期:2015-06-18
- 工作地点:北京
- 招聘人数:1
- 工作经验:3-4年
- 学历要求:本科
- 职位月薪:面议
- 职位类别:互联网软件开发工程师 高级软件工程师
职位描述
岗位职责:
1、负责传统网页和微博及SNS网站信息高效采集与正确解析;
2、负责网页爬虫架构设计与核心技术研发;
3、负责互联网资源的特征挖掘,主要对网页特征、站点结构、资源变化趋势等进行数据分析和特征建模;
4、设计策略和算法,提升网页抓取的效率和质量,进一步解决系统的网页排重、垃圾控制、资源划分等问题;
5、分析爬虫系统的技术缺陷,对策略架构做出合理地调整和改进。
任职资格:
1、计算机、信息技术或相关专业本科或以上学历;
2、有三年以上软件设计与开发经验;
3、精通C/C++、Java语言编程,熟悉linux平台;
4、熟悉XML、JSON、SOAP协议;
5、精通网页爬虫、分布式、多线程开发技术者优先;
7、有搜索相关领域如网页抓取/解析、信息挖掘、统计分析等研发经验者优先;
8、具有很强的分析和解决问题的能力,攻克难题的强烈兴趣,善于学习。
1、负责传统网页和微博及SNS网站信息高效采集与正确解析;
2、负责网页爬虫架构设计与核心技术研发;
3、负责互联网资源的特征挖掘,主要对网页特征、站点结构、资源变化趋势等进行数据分析和特征建模;
4、设计策略和算法,提升网页抓取的效率和质量,进一步解决系统的网页排重、垃圾控制、资源划分等问题;
5、分析爬虫系统的技术缺陷,对策略架构做出合理地调整和改进。
任职资格:
1、计算机、信息技术或相关专业本科或以上学历;
2、有三年以上软件设计与开发经验;
3、精通C/C++、Java语言编程,熟悉linux平台;
4、熟悉XML、JSON、SOAP协议;
5、精通网页爬虫、分布式、多线程开发技术者优先;
7、有搜索相关领域如网页抓取/解析、信息挖掘、统计分析等研发经验者优先;
8、具有很强的分析和解决问题的能力,攻克难题的强烈兴趣,善于学习。
公司介绍
经济信息咨询。