网络爬虫开发工程师
上海欣漾广告有限公司
- 公司规模:50-150人
- 公司性质:民营公司
- 公司行业:广告
职位信息
- 发布日期:2016-11-10
- 工作地点:上海-普陀区
- 招聘人数:若干人
- 工作经验:无工作经验
- 职位月薪:10000-14999/月
- 职位类别:软件工程师
职位描述
职位描述:
岗位职责:
1. 参与核心爬虫系统设计、数据库设计; ?
2. 负责网络爬虫的设计开发; ?
3. 设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量; ?
4. 分析爬虫系统的技术缺陷,对策略架构做出合理地调整和改进;
5. 实现微信等社交媒体平台的数据抓取系统,具体包括抓取任务调度、数据抓取(模拟器和Web多种途径)、性能优化算法设计等内容
6. 在分布式计算环境下,实现数据提取、清洗、结构化、入库、统计分析等需求。
任职要求:
1. 在数据抽取,文本相似性算法,海量数据处理等相关领域有一定的经验积累,具有较好的创新能力和较强的团队合作能力;对搜索系统相关的网页爬虫、网络数据采集等领域有实际经验者优先;
2. 熟悉Linux环境;熟悉HTTP协议,熟练使用一门以上脚本语言(Shell/Python/PHP等);
3. 精通信息抓取和整合技术,从结构化的和非结构化的数据中获取信息,掌握正则表达式; ?
4. 熟悉大规模网页爬取,深度网页爬取,熟悉Nutch、Scrapy、Lucene、Heritrix、Solr、Sphinx等工具优先考虑; ?
5. 并至少用过一种关系型数据库例如MySQL。
其他要求
1. 1年PHP、Python开发经验,熟悉常用的信息抓取策略和数据重组方法;
2.理解能力强,知识面广、学习能力强、专注诚实。
3.最好有大学本科及以上,计算机相关专业学历。
4.有微博、微信等数据抓取经验优先,对Nutch,Scrapy等开源数据抓取框架者优先;
举报
分享
岗位职责:
1. 参与核心爬虫系统设计、数据库设计; ?
2. 负责网络爬虫的设计开发; ?
3. 设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量; ?
4. 分析爬虫系统的技术缺陷,对策略架构做出合理地调整和改进;
5. 实现微信等社交媒体平台的数据抓取系统,具体包括抓取任务调度、数据抓取(模拟器和Web多种途径)、性能优化算法设计等内容
6. 在分布式计算环境下,实现数据提取、清洗、结构化、入库、统计分析等需求。
任职要求:
1. 在数据抽取,文本相似性算法,海量数据处理等相关领域有一定的经验积累,具有较好的创新能力和较强的团队合作能力;对搜索系统相关的网页爬虫、网络数据采集等领域有实际经验者优先;
2. 熟悉Linux环境;熟悉HTTP协议,熟练使用一门以上脚本语言(Shell/Python/PHP等);
3. 精通信息抓取和整合技术,从结构化的和非结构化的数据中获取信息,掌握正则表达式; ?
4. 熟悉大规模网页爬取,深度网页爬取,熟悉Nutch、Scrapy、Lucene、Heritrix、Solr、Sphinx等工具优先考虑; ?
5. 并至少用过一种关系型数据库例如MySQL。
其他要求
1. 1年PHP、Python开发经验,熟悉常用的信息抓取策略和数据重组方法;
2.理解能力强,知识面广、学习能力强、专注诚实。
3.最好有大学本科及以上,计算机相关专业学历。
4.有微博、微信等数据抓取经验优先,对Nutch,Scrapy等开源数据抓取框架者优先;
职能类别: 软件工程师
公司介绍
欣漾广告有限公司是一家专业广告整合营销策划服务机构倡导“创意策划,卓越执行”的服务理念,拥有完整,独立,专业的服务团队,胜任从调研,方案,执行控制反馈,效果评估的全案,全程公关服务。业务执行能力和强大的媒介关系网络可覆盖全国,是一家飞速成长并具有竞争优势的智囊型广告策略团队。 • 我们的营销顾问团队所有成员分别在金融、汽车、房地产、餐饮等行业有着多年的从业经历,具备丰富的实战营销经验,并兼有广阔的营销视野,可以为您提供更具突破性的创意策略,协助您更有效的决策。我们整合技术及服务,为您提供更高效的营销解决方案。我们的营销策划服务更注重营销结果。营销策划活动要取得好的效果还必须有严谨细致的配套执行。从营销策划策略规划、客户细分到活动执行、活动报告,我们除经验丰富的策略顾问专家外,更拥有专业的项目执行人员可以确保实现项目目标。
联系方式
- 公司地址:地址:span陕西北路1438号财富时代大厦2108室