Python爬虫工程师
广州特道信息科技有限公司
- 公司规模:50-150人
- 公司性质:民营公司
- 公司行业:计算机软件
职位信息
- 发布日期:2019-11-27
- 工作地点:广州
- 招聘人数:1人
- 工作经验:1年经验
- 学历要求:大专
- 职位月薪:6-8千/月
- 职位类别:软件工程师
职位描述
岗位职责:
1、负责分布式网络爬虫系统及数据库的设计与开发;
2、设计爬虫策略和防屏蔽规则,解决封账号、封IP、验证码等难点;
3、维护和优化已有的爬虫服务;
4、负责爬虫核心算法的策略优化研究,充分利用资源,提升网页抓取的效率和质量;
5、维护微信公众号数据的爬虫程序以及其他微信相关业务逻辑程序。
任职要求:
1、全日制计算机相关专业,有实际工作经验1年或以上;
2、熟练使用Python,有良好的编码习惯;
3、熟悉Linux操作系统,熟练使用常用命令;
4、至少熟悉一种常用数据库:Mysql / MongDB / Redis;
5、熟练使用 requests、urllib模块;
6、熟悉各种反爬机制和解决措施 (模拟请求头、设置 IP 代理、cookies, 字体反爬、js混淆加密等);
7、精通网页抓取原理及技术、深度抓取、动态网页技术抓取、浏览器模拟抓取技术,从结构化的和非结构化的数据中获取信息;
8、熟悉Scrapy、Pyspider等主流爬虫框架使用;
9、有Flask等Web框架开发经验优先。
公司介绍
广州特道信息科技有限公司成立于2016年3月,以人工智能为主营业务和主要研发方向,团队在大数据采集、大吞吐量数据集中、跨集群数据处理、数据分析、数据挖掘、可视化、人脸识别、物体识别、音视频分析等技术上都有大量完全自主的知识产权以及市场应用。核心技术团队成员来自多个国际顶尖院校和知名软件技术公司,目前已积累知识产权100多项。
公司拥有1000台服务器的研发设备支撑,拥有完善的大数据运营环境;其中高端服务器占比超过30%;同时具备以***全同步集群,在安全性、可靠性上做了***程度地部署。公司通过自主研发的一站式数据存储和数据分析为一体的完整平台,完全弥补大数据存储分析时对资源整合的空白。
公司目前处于迅速崛起阶段,一直坚持以高新技术为实体,以诚信、服务至上思维为方向。在为实现企业信息化的过程中,同时实现了自身的价值的提升,取得与合作方***程度的双赢局面。
不忘初心、方得始终——未来,特道将走市场化发展道路,继续保持技术领先、用户认可的核心优势,引领国产数据库和AI核心算法的发展。
公司愿景
- 业界领先的人工智能核心技术,涉及计算机图像,语音和自然语言处理等领域
- 高效连结算法和应用场景,“算法为王,场景落地”
- 构建完整ABCD生态圈,A - 人工智能,B - 大数据,C - 云计算, D - 企业级软件开发
公司拥有1000台服务器的研发设备支撑,拥有完善的大数据运营环境;其中高端服务器占比超过30%;同时具备以***全同步集群,在安全性、可靠性上做了***程度地部署。公司通过自主研发的一站式数据存储和数据分析为一体的完整平台,完全弥补大数据存储分析时对资源整合的空白。
公司目前处于迅速崛起阶段,一直坚持以高新技术为实体,以诚信、服务至上思维为方向。在为实现企业信息化的过程中,同时实现了自身的价值的提升,取得与合作方***程度的双赢局面。
不忘初心、方得始终——未来,特道将走市场化发展道路,继续保持技术领先、用户认可的核心优势,引领国产数据库和AI核心算法的发展。
公司愿景
- 业界领先的人工智能核心技术,涉及计算机图像,语音和自然语言处理等领域
- 高效连结算法和应用场景,“算法为王,场景落地”
- 构建完整ABCD生态圈,A - 人工智能,B - 大数据,C - 云计算, D - 企业级软件开发
联系方式
- 公司地址:地址:span东方文德广场