爬虫开发工程师
上海睿翎法律咨询服务有限公司
- 公司规模:少于50人
- 公司性质:民营公司
- 公司行业:法律
职位信息
- 发布日期:2019-07-30
- 工作地点:上海-青浦区
- 招聘人数:2人
- 工作经验:1年经验
- 学历要求:本科
- 职位月薪:0.9-1.5万/月
- 职位类别:软件工程师 互联网软件开发工程师
职位描述
职位信息:
1. 参与核心爬虫系统/解析系统架构设计、数据库设计;
2. 设计各种策略和算法,提升抓取效果;
3. 解决网页抓取,信息抽取等问题,构建高可用性,高扩展性网络信息采集平台;
4. 对互联网海量业务数据进行整合、分析挖掘;
5. 解决封账号,封IP采集等难点攻克。
任职要求:
1、精通爬虫相关技术,如:httpClient/jSoup/xpath/正则表达式/验证码加密处理/代理池等
2、有扎实的计算机基础、熟悉常用数据结构,具有实际爬虫开发经验
3、至少熟练掌握Java/Python其中一种语言,良好的编码风格及编码能力
4、掌握常用数据库(如:MySQL,Mongodb)及相应DDL/DML,熟悉索引及常规SQL调优
5、掌握常用开发管理工具及应用服务器,如:Eclipser、Maven、Git/SVN、Tomcat、Nginx等
6、熟悉行为验证码识别、模拟登陆、数据清洗、去重、入库等
7、熟悉HTTP协议,掌握HTML/CSS/JS/JQUERY/AJAX等相关知识
8、熟悉ActiveMQ、Zookeeper、Redis等分布式和NoSQL技术
9、了解Linux系统及Linux常用命令
10、了解Hadoop、HBase、KAFKA等大数据相关知识
11、有运营商网站爬取或逆向经验尤佳
12、熟悉js加密,了解python常见执行js方法,如pyv8
13、有过工商网、文书网、商标网、专利网等网站爬虫经验优先
14、会构建ip池,使用ip接口,有系统性大数据抓取项目,优先考虑
职能类别: 软件工程师 互联网软件开发工程师
公司介绍
网站: *****************
联系方式
- 公司地址:地址:span国家会展中心