北京 [切换城市] 北京招聘

爬虫工程师

上海恒生聚源数据服务有限公司

  • 公司规模:500-1000人
  • 公司性质:民营公司
  • 公司行业:金融/投资/证券

职位信息

  • 发布日期:2021-06-03
  • 工作地点:杭州-江干区
  • 招聘人数:3人
  • 工作经验:3-4年经验
  • 学历要求:本科
  • 职位月薪:1.8-3万/月
  • 职位类别:爬虫开发工程师

职位描述

岗位职责:

1.负责公司数据源抓取需求,满足公司对多源数据采集要求;

2.负责开发分布式爬虫框架,管理分布式爬虫服务器,开发任务调度引擎;

3.负责爬虫核心算法的策略优化研究,提升爬虫抓取效率和质量,提升网页抓取的效率和质量;

4.设计爬虫策略和防屏蔽规则,解决封账号、封IP、验证码、JS加密等难点攻克;

5.利用主流的大数据相关技术,对抓取后的网页数据进行清洗、存储等;并持续优化平台,以便满足各种爬取业务需求。

任职要求:

1.本科及以上学历,计算机相关专业,3年及以上工作经验;

2.熟悉Python/C#/Java语言中的一种,至少3年相关的开发经验

3.有Python分布式抓取系统的开发、架构经验,至少熟悉并使用过一种主流爬虫架构,如Scrapy、Gocolly、Webmagic等优先;

4.熟悉前端页面技术,如html、js、ajax等;

5.有海量数据爬取、解析、清洗、存储相关项目经验;

6.熟悉网页抓取原理及技术,能够总结分析不同网站,网页的结构特点及规律;

7.熟悉反爬策略的应对,能够解决封账号、封IP、验证码、JS加密等问题;

8.熟悉Linux系统环境;

9.熟悉Mysql、Redis、MongoDB等数据库,有过数据库调优和海量数据存储经验者优先。

职能类别:爬虫开发工程师

公司介绍

上海恒生聚源数据服务有限公司一直致力于国内金融信息领域服务,与国内著名的金融机构、媒体、研究机构等单位建立了业务合作关系,还与标准普尔、阿里巴巴及恒生电子等行业领导者建立了紧密的战略合作,业务连续三年以100%的速度增长。公司产品和服务获得了证券公司、基金公司、资产管理公司、商业银行、保险公司和信托公司等机构用户的认可和赞许,确立了在国内金融数据服务领域的领先地位,是国内***的金融资讯服务供应商。
2010年1月,上海恒生聚源数据服务有限公司成为恒生电子(代码600570)控股子公司。随着恒生电子控股恒生聚源,恒生聚源无论从资本实力和外部资源都有了很大的提升。公司将更加专注于主业,以客户的需求为导向,以提高客户满意度为己任,为中国的金融业提供最为优质的服务。2013年起公司与标准普尔、阿里巴巴等行业领导者建立了紧密的战略合作。2014年***财经、浙江蚂蚁小微金融服务集团有限公司、宁波云汉投资正式入驻上海恒生聚源,与恒生聚源进行深度业务合作。

专业的技术团队
公司汇聚了近300名具有丰富行业经验的专业管理人员、技术开发人员、金融行业研究人员,大学本科及硕士以上学历的员工占员工总数的三分之二以上,员工规模及素质均居同业前列;核心管理团队都具有10年以上的金融行业服务经历,具有丰富的行业经验和管理能力。

成熟的公司产品
恒生聚源拥有聚源终端、金融数据库、咨询终端、投研平台、投资终端等业内最丰富的产品,被广泛应用于国内主流金融机构。

稳定的市场业务
公司立足于上海,服务于全国。在北京、深圳、天津、沈阳、济南、成都、西安、武汉、广州等大中城市都建立了分支机构,为客户提供及时、细致、周到的服务。

宏伟的企业愿景
恒生聚源立志为中国金融业持续提供最优质、***效的数据服务,把成为中国的“Bloomberg”作为我们不懈努力的奋斗目标。

邮箱:shenlq@gildata.com

联系方式

  • Email:shenlq@gildata.com
  • 公司地址:上海市浦东新区峨山路91弄98号浦东软件园陆家嘴分园10号楼7~8层