高级爬虫工程师(DX22wjj)
北京东方国信科技股份有限公司
- 公司性质:民营公司
- 公司行业:计算机服务(系统、数据服务、维修)
职位信息
- 发布日期:2020-11-06
- 工作地点:成都
- 招聘人数:1人
- 工作经验:5-7年经验
- 学历要求:本科
- 职位月薪:1.3-1.5万/月
- 职位类别:爬虫开发工程师
职位描述
工作职责:
1.分布式爬虫系统和数据采集的规划、设计、开发;
2.爬虫策略和防屏蔽规则,提升网页抓取的效率和质量;
3.各类互联网数据的采集抓取(有头部网站如:淘宝、京东爬取能力优先考虑);
4.理解系统数据处理流程以及业务功能需求;
5.负责核心算法的设计与开发;
6.指导和培训初中级工程师;
任职资格:
1.5年+以上实际的爬虫项目经验,1+年以上逆向破解账号系统能力;
2.熟悉java,掌握python,熟悉常用爬虫框架中的一种或多种,如Scrapy框架或其他的Web scraping framework;
3.熟悉HTML/JavaScript/CSS/xpath/url/Ajax/xml等web技知识,熟悉HttpClient、jsoup、WebDriver、phantomjs等工具;
4.熟悉linux系统,熟悉mysql、redis,nosql等,熟悉Internet基本协议(如TCP/IP. HTTP等);
5.能够解决封账号、封IP采集等问题,解决网页抓取、信息抽取等问题,构建完善的网络信息收集平台;
6.具备丰富的逆向工程经验,尤其在Android、iOS平台的逆向工程经验。有成功逆向过复杂软件数据结构、功能、算法的经历;
7.负责网络爬虫采集规则的编写,有分布式爬虫架构经验者优先;
8.有数据分析、数据挖掘相关经验者优先。
备注:岗位要求,包括但不限于以下几个方面:
1、此岗位必备知识;2、此岗位所需计算机技术;3、此岗位所需工作经验;4、个人软性素质要求;
5、其它方面要求;
职能类别:爬虫开发工程师
公司介绍
北京东方国信科技股份有限公司成立于1997年,2011年上市(股票代码300166),是国内首批以大数据为题材上市的软件公司。截至目前拥有18个全资子公司,在全国31个省市自治区都设有分支机构,业务覆盖全球50余个国家的上千客户,员工规模突破万人。
经过24年在大数据、云计算领域的持续深耕,东方国信形成了横向跨行业、纵向全产业链的业务布局,拥有基于大数据、云计算等高新技术的全链条、全自主知识产权的技术研发体系。打造了CirroData高性能分布式数据库、Cloudiip工业互联网平台、东方国信云Boncloud、数据科学云平台“图灵引擎”等业内领先的技术产品,凭借卓越的大数据软件产品和解决方案,成功服务于通信、金融、工业、智慧城市、政府与公安、农业、医疗、新零售等领域的数千客户。
随着东方国信在大数据端到端软件技术和大数据+行业拓展两个方面优势地位的确立,东方国信拥有纵向打通的统一的云计算软件栈,全面支撑公司云服务业务,构建一站式、端到端、全栈式的云服务能力,向着领先的云网融合大数据服务商迈进。
经过24年在大数据、云计算领域的持续深耕,东方国信形成了横向跨行业、纵向全产业链的业务布局,拥有基于大数据、云计算等高新技术的全链条、全自主知识产权的技术研发体系。打造了CirroData高性能分布式数据库、Cloudiip工业互联网平台、东方国信云Boncloud、数据科学云平台“图灵引擎”等业内领先的技术产品,凭借卓越的大数据软件产品和解决方案,成功服务于通信、金融、工业、智慧城市、政府与公安、农业、医疗、新零售等领域的数千客户。
随着东方国信在大数据端到端软件技术和大数据+行业拓展两个方面优势地位的确立,东方国信拥有纵向打通的统一的云计算软件栈,全面支撑公司云服务业务,构建一站式、端到端、全栈式的云服务能力,向着领先的云网融合大数据服务商迈进。
联系方式
- Email:zhangchuange@bonc.com.cn