合肥 [切换城市] 合肥招聘合肥IT-品管、技术支持及其它招聘合肥技术支持/维护工程师招聘

网络爬虫工程师

北京博瑞浩宇科技有限公司

  • 公司规模:50-150人
  • 公司性质:民营公司
  • 公司行业:互联网/电子商务

职位信息

  • 发布日期:2017-06-22
  • 工作地点:合肥
  • 招聘人数:1人
  • 职位月薪:3-4.5千/月
  • 职位类别:技术支持/维护工程师  

职位描述

职位描述:
岗位职责:
1、负责对互联网上相关领域的文本数据进行抓取、分析与整理;
2、模式识别相关数据的处理,智能数据分析模块编写。
3、研究相关站点的网站特征,发现它们的特点和规律,设计各种爬虫策略和算法;
4、开发爬虫程序,提取文本、链接、图片、文件等各类信息,并持续提升爬虫的抓取效果;
5、持续分析爬虫的技术缺陷,并做出合理地调整或改进;
6、智能抽取工具的开发。
任职资格:
1、熟悉Linux平台,对CCJavaPython中至少一种熟练掌握。
2、精通Java网络编程,熟悉HTTP传输协议,能模拟浏览器操作爬虫;
3、精通网页抓取原理及技术,精通正则表达式,从结构化的和非结构化的数据中获取信息;
4、熟悉LuceneNutchHeritrixlarbinHtmlClientHtmlParser等开源工具;
5、熟悉HBase,MongoDB等NoSQL数据库,并至少精通一种关系型数据库的开发,如Mysql、Oracle、MSSQL等;
6、熟悉搜索引擎和网络爬虫相关技术,如有分词、spider、分类、聚类、索引、检索等相关开发经验者优先。

职能类别: 技术支持/维护工程师

关键字: 计算机

举报 分享

公司介绍

技术开发、技术转让、技术服务;信息咨询(中介除外);接受委托提供劳务服务;销售电子产品、计算机软硬件及辅助设备、日用品。(企业依法自主选择经营项目,开展经营活动;依法须经批准的项目,经相关部门批准后依批准的内容开展经营活动;不得从事本市产业政策禁止和限制类项目的经营活动。)

联系方式

  • 公司地址:上班地址:黄山路与潜山路交口向南200米新华国际广场B座12A楼1202-1204