重庆 [切换城市] 重庆招聘重庆计算机软件招聘重庆高级软件工程师招聘

爬虫开发工程师

天宇正清科技有限公司

  • 公司规模:150-500人
  • 公司性质:民营公司
  • 公司行业:计算机服务(系统、数据服务、维修)

职位信息

  • 发布日期:2020-03-18
  • 工作地点:北京-石景山区
  • 招聘人数:3人
  • 工作经验:本科
  • 学历要求:招3人
  • 语言要求:不限
  • 职位月薪:1.5-2.5万/月
  • 职位类别:高级软件工程师

职位描述

岗位职责:

1、 负责爬虫系统的设计、开发,以及网页抓取的效率和质量优化;

2、 负责对目标网站进行数据爬取分析,找到最优化的爬取策略;

3、 负责爬虫核心算法的策略优化研究,提升爬虫抓取效率和质量(如调权调度、分析预测、质量判断、封禁与反封禁研究等);

4、 通过机器学习、深度学习等技术,建立数据挖掘模型,解决实际业务问题;

5、 负责大规模数据爬虫的性能优化、监控和报警,提高爬虫产品的稳定性和抓取效率;

6、 负责技术难点的攻克。

职位要求:

1、 计算机或相关专业本科以上学历,8年以上爬虫工作经验;

2、 精通Python语言特点及运行机制;

3、 精通LNMP架构,有较强的架构能力和良好代码规范; 

4、 熟练掌握Python主流爬虫架构,精通Django架构;

5、 熟练掌握正则表达式、XPath、CSS等网页信息抽取技术;

6、 熟悉常见反爬机制,验证码识别,IP代理池、应用Ip池、headers认证和cookie等;

7、 熟练掌握应用Selenium+PhantomJS实施动态HTML抓取;

8、 熟悉熟练使用http代理工具charles、fiddler等;

9、 熟练掌握Linux平台开发,能独立安装、配置、搭建开发环境,编写shell脚本;

10、 精通Postpresql,Oracle,mysql等关系数据库;

11、 熟悉mongodb/hadoop、redis、rabbitMQ、kafka、zookeeper 等具有项目经验;

12、 熟悉自然语言处理、有一定算法功底,有python舆情产品、爬虫项目经验者优先;

13、 能承受一定的工作压力,有责任心、上进心,具备良好的自学能力和独立解决问题能力。

职能类别:高级软件工程师

关键字:爬虫

公司介绍

天宇正清科技有限公司(简称“天宇正清”)2006年成立于中关村高科技园区(德胜科技园)。
我们坚持以客户满意为目标,强调质量至上,精益求精。公司通过了国家高新技术企业认证、中关村高新企业认证、ISO9000质量管理体系认证、ISO14000环境体系认证、ISO18000安全体系认证以及ISO20000信息技术服务认证等。
公司致力于为通信、能源、房地产和金融等行业提供具有竞争力的通信、IT技术、系统集成解决方案。以人为本构建流程管理和质量保证体系驱动的管理架构,借鉴国际知名企业管理经验及软件服务市场特点,拥有多名高级管理成员和资深技术团队,在通信、IT技术、系统集成服务领域不断探索和发展,成为业界领先的通信、IT技术、系统集成综合解决方案服务提供商。
天宇正清现有员工400余人,90%以上人员拥有大学本科及以上学历。与多所大学院校建立了校企合作关系,在为毕业生提供实训基地的同时,也为转化相关的科研成果建立了良好的渠道。公司业务区域覆盖全国十余省市,并在相关区域设立分公司及办事机构。
我们的主要合作伙伴:中国移动设计院、中国移动物联网公司、中移全通系统集成公司、中移铁通有限公司、中国普天集团、上海大唐移动、神华和利时信息公司、远洋集团、万达集团、泰禾集团、中国网络电视台、玖富集团等。

联系方式

  • 公司地址:地址:span钦江路333号