java数据抓取工程师/爬虫工程师
优讯时代(北京)网络技术有限公司
- 公司规模:50-150人
- 公司性质:合资(欧美)
- 公司行业:计算机服务(系统、数据服务、维修)
职位信息
- 发布日期:2018-04-04
- 工作地点:北京
- 招聘人数:2人
- 工作经验:2年经验
- 职位月薪:10000-14999/月
- 职位类别:软件工程师 互联网软件开发工程师
职位描述
职位描述:
岗位职责:
1、负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析;
2、负责网页信息抽取、数据清洗等研发和优化工作;
3、负责抓取数据的深度提取和挖掘。
任职要求:
1、 计算机、通信及相关专业本科以上学历;
2、 熟悉J2EE架构下的MVC开发模式,熟练掌握Struts、Spring、Hibernate开发框架。
3、 熟悉数据库相关知识,掌握MySQL等数据库,熟悉NoSQL技术、有DB2、Hbase开发经验者优先。
4、 具有Web前端开发工作经验,熟练使用JavaScript、JQuery、HTML、CSS等前端开发技术并具备良好的沟通、理解能力。
5、 精通Java服务器端编程,有3年以上Java爬虫开发经验优先;
6、 熟悉Linux操作系统下的基本操作。
7、熟悉网页抓取原理及技术,熟悉基于Cookie的网站登录原理,熟悉基于正则表达式、XPath、CSS等网页信息抽取技术;
8、有多线程、多进程、网络通信编程相关开发经验;
9、有分布式爬虫架构,数据挖掘经验优先。
举报
分享
岗位职责:
1、负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析;
2、负责网页信息抽取、数据清洗等研发和优化工作;
3、负责抓取数据的深度提取和挖掘。
任职要求:
1、 计算机、通信及相关专业本科以上学历;
2、 熟悉J2EE架构下的MVC开发模式,熟练掌握Struts、Spring、Hibernate开发框架。
3、 熟悉数据库相关知识,掌握MySQL等数据库,熟悉NoSQL技术、有DB2、Hbase开发经验者优先。
4、 具有Web前端开发工作经验,熟练使用JavaScript、JQuery、HTML、CSS等前端开发技术并具备良好的沟通、理解能力。
5、 精通Java服务器端编程,有3年以上Java爬虫开发经验优先;
6、 熟悉Linux操作系统下的基本操作。
7、熟悉网页抓取原理及技术,熟悉基于Cookie的网站登录原理,熟悉基于正则表达式、XPath、CSS等网页信息抽取技术;
8、有多线程、多进程、网络通信编程相关开发经验;
9、有分布式爬虫架构,数据挖掘经验优先。
职能类别: 软件工程师 互联网软件开发工程师
公司介绍
优讯,中国全媒体舆情监测服务提供商,于2007年2月创立于北京中关村。公司凭借自主研发的软件开发技术,通过优讯网 (www.uuwatch.com),提供电视、报刊和网络的全媒体舆情监测服务,是北京市政府指定采购的自主创新产品。优讯每天能对近100家电视频道、近1000家主流报刊、1万多家网络站点的媒体资讯进行实时监测,把用户关注的媒体资讯及时提供给用户。我们服务的用户囊括众多国家部委、地方政府和知名企业。
蒋亚洪博士,公司创始人、总裁,中国传媒大学大数据与公共事务实验室 主任、特聘教授,首席科学家,国家特聘专家,入选北京市"海聚工程"海外高层次创业人才,荣获北京中关村科技园区优秀创业留学人员嘉奖。
联系电话:010-82895510
蒋亚洪博士,公司创始人、总裁,中国传媒大学大数据与公共事务实验室 主任、特聘教授,首席科学家,国家特聘专家,入选北京市"海聚工程"海外高层次创业人才,荣获北京中关村科技园区优秀创业留学人员嘉奖。
联系电话:010-82895510
联系方式
- Email:hr@uuwatch.com
- 公司地址:地址:span北京市海淀区西北旺东路10号院中关村软件园互联网创新中心五层503A