全栈工程师 爬虫数据抓取网页设计
苏州三只野兔信息科技有限公司
- 公司规模:50-150人
- 公司性质:合资
- 公司行业:计算机软件
职位信息
- 发布日期:2017-07-05
- 工作地点:苏州
- 招聘人数:若干人
- 职位月薪:6-8万/年
- 职位类别:互联网软件开发工程师
职位描述
职位描述:
1.负责设计、开发分布式爬虫及数据采集系统
2.负责大规模文本、图像、视频数据的抓取、抽取,去重、分类,垃圾过滤,质量识别等工作。
3.负责设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量;
4.最好会一些前端知识、熟悉相关脚本、熟悉后台数据库处理、
任职资格:
1、计算机、信息技术相关专业大专或以上学历;
2、有两年以上软件设计与开发经验;精通pythonJavacc++语言编程,熟悉windowsLinux平台;
3、两年以上大规模网页爬虫开发经验,熟悉XML、JSON、SOAP协议、JS、AJAX、网页去重,熟悉搜索引擎的工作原理,能够总结分析不同网站的结构特点与规律;
4、有分布式爬虫架构经验者及大型开源爬虫实践者,速来;
5、对算法设计和数据结构有深刻的理解, 精通网络编程,精通多线程多进程编程者,速来;
6、有实际产品或系统开发经验,有知名或可证明的系统效果优先;
7、具有很强的分析和解决问题的能力,攻克难题的强烈兴趣,善于学习新知识;
8、有深度采集经验者优先。
举报
分享
1.负责设计、开发分布式爬虫及数据采集系统
2.负责大规模文本、图像、视频数据的抓取、抽取,去重、分类,垃圾过滤,质量识别等工作。
3.负责设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量;
4.最好会一些前端知识、熟悉相关脚本、熟悉后台数据库处理、
任职资格:
1、计算机、信息技术相关专业大专或以上学历;
2、有两年以上软件设计与开发经验;精通pythonJavacc++语言编程,熟悉windowsLinux平台;
3、两年以上大规模网页爬虫开发经验,熟悉XML、JSON、SOAP协议、JS、AJAX、网页去重,熟悉搜索引擎的工作原理,能够总结分析不同网站的结构特点与规律;
4、有分布式爬虫架构经验者及大型开源爬虫实践者,速来;
5、对算法设计和数据结构有深刻的理解, 精通网络编程,精通多线程多进程编程者,速来;
6、有实际产品或系统开发经验,有知名或可证明的系统效果优先;
7、具有很强的分析和解决问题的能力,攻克难题的强烈兴趣,善于学习新知识;
8、有深度采集经验者优先。
职能类别: 互联网软件开发工程师
公司介绍
三只野兔信息科技集中来自全国各个高校的优秀毕业生、秉承着团结、互助、追逐、共享的精神、以竭尽全力、永无止境的向客户提供优质高效的解决方案为目标、持续的努力并进步着;我们欢迎各位有志向的励志青年加入我们一起win个未来;
联系方式
- 公司地址:上班地址:永金商业广场地铁2号线陆慕站沿线