python爬虫工程师
北京环球天辰信息咨询有限公司
- 公司规模:50-150人
- 公司性质:民营公司
- 公司行业:建筑/建材/工程
职位信息
- 发布日期:2019-07-31
- 工作地点:北京-房山区
- 招聘人数:若干人
- 工作经验:无工作经验
- 学历要求:招若干人
- 语言要求:不限
- 职位月薪:0.8-1万/月
- 职位类别:互联网软件开发工程师
职位描述
1. 负责多平台信息爬取和页面内容的提取分析;
2. 负责爬虫系统的架构设计和研发,独立进行抓取和清洗工作;
3. 负责大规模数据爬虫的性能优化工作;
4. 负责HTTP、AJAX等各类网络请求分析,探索和研究高效的数据抓取解决方案
5. 不断完善和重构现有爬虫系统,通过对抓取、解析、调度、存储等模块的拆分与优化,构建和完善统一的抓取服务平台。
岗位要求:
1. 全日制本科及以上学历,计算机相关专业,有2年以上的爬虫开发经验;
2. 熟悉HTTP协议,掌握HTML/CSS/JS/JQUERY/AJAX等相关知识
3. 精通爬虫相关技术,如:httpClient/jSoup/xpath/CSS/正则表达式/验证码加密处理/代理池等网页信息抽取技术
4. 熟悉网页抓取原理及技术,熟悉基于Cookie的网站登录原理,熟悉基本网络协议
5. 熟悉行为验证码识别、模拟登陆、数据清洗、去重、入库等.
职能类别: 互联网软件开发工程师
公司介绍
天辰TCBCI(北京环球天辰信息咨询有限公司)成立于1998年,专业提供建筑信息与服务。经过22年的努力,天辰TCBCI已发展成为我国工程项目信息和建材产品信息领先的提供商。
天辰TCBCI的投资人有在国际上享有盛誉的传媒行业和专业媒体的领导人,包括世界500强公司--德国贝塔斯曼总公司的前任董事会主席、CEO和现任监事会主席。
天辰TCBCI在2008年3月收购了东南亚和澳大利亚首屈一指的工程信息服务供应商--宝利亚洲BCI Asia集团公司的中国业务。
天辰TCBCI总部设在北京,目前在上海、广州,武汉,重庆设有分公司。
虽然被众多企业模仿,但天辰TCBCI始终坚持原创、贴近客户需求,因而持续在行业内领先。建筑行业几千家企业,包括国内外众多优秀企业,已经在使用天辰TCBCI的专业服务。
天辰TCBCI提供合理的薪酬以及平等的晋升空间,热忱欢迎优秀人才加盟!
天辰TCBCI的投资人有在国际上享有盛誉的传媒行业和专业媒体的领导人,包括世界500强公司--德国贝塔斯曼总公司的前任董事会主席、CEO和现任监事会主席。
天辰TCBCI在2008年3月收购了东南亚和澳大利亚首屈一指的工程信息服务供应商--宝利亚洲BCI Asia集团公司的中国业务。
天辰TCBCI总部设在北京,目前在上海、广州,武汉,重庆设有分公司。
虽然被众多企业模仿,但天辰TCBCI始终坚持原创、贴近客户需求,因而持续在行业内领先。建筑行业几千家企业,包括国内外众多优秀企业,已经在使用天辰TCBCI的专业服务。
天辰TCBCI提供合理的薪酬以及平等的晋升空间,热忱欢迎优秀人才加盟!
联系方式
- Email:huanghongbo@tcbci.com
- 公司地址:地址:span上海市徐汇区中山西路2025号永升大厦907-909室