网络爬虫工程师
广州创品知识产权服务有限公司
- 公司规模:150-500人
- 公司性质:民营公司
- 公司行业:专业服务(咨询、人力资源、财会)
职位信息
- 发布日期:2017-11-07
- 工作地点:广州-天河区
- 招聘人数:若干人
- 工作经验:3-4年经验
- 学历要求:大专
- 职位月薪:5000-19999/月
- 职位类别:互联网软件开发工程师 数据库工程师/管理员
职位描述
职位描述:
职位职责:
1、 负责爬虫系统架构设计和数据存储设计;
2、 抽取网页内容,设计特定的和通用的网页匹配模板;
3、 设计爬虫策略,提升网页抓取的效率和质量,合理控制抓取频率;
4、 分析爬虫系统的技术缺陷,对策略架构做出合理地调整和改进。
任职要求:
1.熟悉linux平台开发,熟悉Python/C++/Java/golang等编程语言中的至少一种;
2.熟悉HTML5、CSS3、JavaScript 等Web前端语言
3.熟悉Ajax、DOM、XML、JSON等相关技术,能使用原生JS编程,熟悉面向对象;
4.使用过bootstrap、jquery、angularjs、vue.js至少一种js框架
5.熟悉 HTTP 及 TCP 等网络协议,了解异步IO模型及常用异步IO框架;
6.了解正则表达式,熟悉网页结构化内容抽取;
7.熟悉mysql,postgreSQL等至少一种关系型数据库;
8.有大规模网页爬取经验者优先,熟悉Nutch、Selenium、Scrapy、PhantomJS等工具优先;
9、 有分词、文本检索、自然语言处理等相关经验者优先。
举报
分享
职位职责:
1、 负责爬虫系统架构设计和数据存储设计;
2、 抽取网页内容,设计特定的和通用的网页匹配模板;
3、 设计爬虫策略,提升网页抓取的效率和质量,合理控制抓取频率;
4、 分析爬虫系统的技术缺陷,对策略架构做出合理地调整和改进。
任职要求:
1.熟悉linux平台开发,熟悉Python/C++/Java/golang等编程语言中的至少一种;
2.熟悉HTML5、CSS3、JavaScript 等Web前端语言
3.熟悉Ajax、DOM、XML、JSON等相关技术,能使用原生JS编程,熟悉面向对象;
4.使用过bootstrap、jquery、angularjs、vue.js至少一种js框架
5.熟悉 HTTP 及 TCP 等网络协议,了解异步IO模型及常用异步IO框架;
6.了解正则表达式,熟悉网页结构化内容抽取;
7.熟悉mysql,postgreSQL等至少一种关系型数据库;
8.有大规模网页爬取经验者优先,熟悉Nutch、Selenium、Scrapy、PhantomJS等工具优先;
9、 有分词、文本检索、自然语言处理等相关经验者优先。
职能类别: 互联网软件开发工程师 数据库工程师/管理员
关键字: 爬虫 抓取 网页爬取 数据提取 软件开发 网络蜘蛛 大数据 分析 IO linux
公司介绍
创品知识产权始创于2001年,总部位于广州天河CBD,是国内知名知识产权服务机构,旗下包括七家公司和十余家办事机构,服务网络覆盖全中国及东南亚等地。现有员工300余人,由法律、调查、外语等专业化人才团队组成。
创品核心业务包括知识产权维权服务、知识产权运营服务、知识产权大数据信息服务、知识产权咨询服务等,为海内外近二百家世界五百强企业以及政府机构提供知识产权一站式专业化服务。经过二十余年的持续稳健运营,专业化水平获得行业一致认可,荣获近二十项行业资质认证,并连续数年当选广州市高端专业服务业重点企业。
加入创品,您可以获得富有市场竞争力的薪资待遇,平等友爱的工作环境,学习掌握全方位的专业化知识和技能以及广阔的个人发展空间。
创品核心业务包括知识产权维权服务、知识产权运营服务、知识产权大数据信息服务、知识产权咨询服务等,为海内外近二百家世界五百强企业以及政府机构提供知识产权一站式专业化服务。经过二十余年的持续稳健运营,专业化水平获得行业一致认可,荣获近二十项行业资质认证,并连续数年当选广州市高端专业服务业重点企业。
加入创品,您可以获得富有市场竞争力的薪资待遇,平等友爱的工作环境,学习掌握全方位的专业化知识和技能以及广阔的个人发展空间。
联系方式
- 公司地址:小行路16号