Python爬虫工程师
以尧企业发展(上海)有限公司
- 公司规模:50-150人
- 公司性质:民营公司
- 公司行业:计算机软件
职位信息
- 发布日期:2017-07-17
- 工作地点:上海-徐汇区
- 招聘人数:1人
- 工作经验:1年经验
- 学历要求:本科
- 职位月薪:1-1.8万/月
- 职位类别:软件工程师 算法工程师
职位描述
职位描述:
你需要做的:
1.能独立负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析工作;
2.负责网页信息排重,提升平台的抓取效率;
3.负责爬虫核心算法和策略优化,熟悉采集系统的调度策略;
4.实时监控爬虫的进度和警报反馈。
我们期待你:
1.熟悉Linux系统,熟练掌握Python语言,掌握Java和C++语言;
2.了解多线程、多进程、网络通信编程相关知识,有分布式爬虫架构经验;
3.掌握网页抓取原理及技术,了解基于Cookie的登录原理,熟悉基于正则表达式、XPath、CSS等网页信息抽取技术;
4.有通过动态替换代理IP,攻克防爬技术的经验者优先;
5.熟悉验签破解技术,了解APP用户授权访问机制,掌握Selenium,APP破解技术优先;
6.做过数据处理、ETL等相关工作优先。
举报
分享
你需要做的:
1.能独立负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析工作;
2.负责网页信息排重,提升平台的抓取效率;
3.负责爬虫核心算法和策略优化,熟悉采集系统的调度策略;
4.实时监控爬虫的进度和警报反馈。
我们期待你:
1.熟悉Linux系统,熟练掌握Python语言,掌握Java和C++语言;
2.了解多线程、多进程、网络通信编程相关知识,有分布式爬虫架构经验;
3.掌握网页抓取原理及技术,了解基于Cookie的登录原理,熟悉基于正则表达式、XPath、CSS等网页信息抽取技术;
4.有通过动态替换代理IP,攻克防爬技术的经验者优先;
5.熟悉验签破解技术,了解APP用户授权访问机制,掌握Selenium,APP破解技术优先;
6.做过数据处理、ETL等相关工作优先。
职能类别: 软件工程师 算法工程师
关键字: Python 爬虫 分布式 抓取 分析 Linux 攻克
公司介绍
于海量的数据分析,利用60多个维度算法实现推荐匹配,筛选出企业适合的人选,取代HR大部分的人才search与沟通工作。根据HR行为,打造可视化的人员素质模型。推荐系统取代前期人工电话沟通,通过邮件、微信、app、手机官网等渠道快速联络候选人。
联系方式
- Email:cuimengjun@walre.com
- 公司地址:地址:span中山公园附近