爬虫工程师
医药魔方
- 公司规模:50-150人
- 公司性质:民营公司
- 公司行业:互联网/电子商务
职位信息
- 发布日期:2020-10-22
- 工作地点:北京-朝阳区
- 招聘人数:2人
- 工作经验:3-4年经验
- 学历要求:本科
- 职位月薪:1-2万/月
- 职位类别:软件工程师
职位描述
岗位职责:
1、负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析工作;
2、负责网页信息和APP数据抽取、清洗、消重等工作,提升平台的抓取效率;
3、参与爬虫核心算法和策略优化,熟悉采集系统的调度策略;
4、实时监控爬虫进度和预警处理。
任职要求:
1、大学本科及以上学历,计算机相关专业,基础扎实;
2、2-3年 python 爬虫相关经验,具备分布式爬虫经验,熟悉 python 常用库;
3、熟练掌握 html、css、xpath、正则表达式、scrapy、selenium、pandas;
4、深入了解 HTTP,TCP/IP 网络协议;
5、熟练使用 Linux、 MySQL、Redis、MongoDB;
6、熟悉常见的反爬策略,有一定的研究和解决问题的能力;
7、具备良好的沟通能力和团队协作精神;具备良好的编码习惯和撰写技术文档能力;
8、具备英文技术文档阅读能力
公司介绍
医药魔方成立于2013年,为医药垂直行业的一站式药品数据服务平台,致力于以数据连接行业,提升行业效率,打造连接全产业链的生态系统。目前,魔方已覆盖数十余万医药行业专业用户,具有较高的知名度与影响力。以数据业务为核心,公司逐步拓展了媒体与投资两个衍生板块,不断深耕,与全产业链多家专业机构达成了战略合作,形成良好的共赢发展生态。
医药魔方对中国、美国、欧盟和日本等全球主流国家的药品(已上市、研发)进行着数据监测,实时掌握着全球药品市场趋势与动态。公司建立了系统化药品数据标准,并积极与管理部门及行业传统数据公司对接合作,力争成为医药数据行业的连接中枢与领跑者。在这个基础上,公司对分散的海量药品数据进行了规模收集、标准化清洗、结构化转换,并串联整合为数据仓库,逐步搭建了从数据监测、数据收集、数据清洗、数据挖掘到数据预测的大数据架构工作体系。并基于人工整理的专业词库,大力发展机器学习,实现自我进化,不断扩充数据仓库与监测项目,努力成为最敏捷、专业的药品大数据监测平台。
目前,魔方自媒体已经较好地覆盖了医药研发、医药投资人群,是项目融资、研发数据发布和人才招聘的值得选择的信息披露平台。
医药魔方对未来产品的规划还有很多有趣的想法正在酝酿落地之中,同时也需要更多有能力、有创意、有激情的小伙伴儿加入医药魔方。
如果你对医药行业数据有兴趣,对个人未来发展有追求,请速速与我们联系,医药魔方深情呼唤每一位有想法的有志青年,这里有足够的空间供您施展才华。
医药魔方对中国、美国、欧盟和日本等全球主流国家的药品(已上市、研发)进行着数据监测,实时掌握着全球药品市场趋势与动态。公司建立了系统化药品数据标准,并积极与管理部门及行业传统数据公司对接合作,力争成为医药数据行业的连接中枢与领跑者。在这个基础上,公司对分散的海量药品数据进行了规模收集、标准化清洗、结构化转换,并串联整合为数据仓库,逐步搭建了从数据监测、数据收集、数据清洗、数据挖掘到数据预测的大数据架构工作体系。并基于人工整理的专业词库,大力发展机器学习,实现自我进化,不断扩充数据仓库与监测项目,努力成为最敏捷、专业的药品大数据监测平台。
目前,魔方自媒体已经较好地覆盖了医药研发、医药投资人群,是项目融资、研发数据发布和人才招聘的值得选择的信息披露平台。
医药魔方对未来产品的规划还有很多有趣的想法正在酝酿落地之中,同时也需要更多有能力、有创意、有激情的小伙伴儿加入医药魔方。
如果你对医药行业数据有兴趣,对个人未来发展有追求,请速速与我们联系,医药魔方深情呼唤每一位有想法的有志青年,这里有足够的空间供您施展才华。
联系方式
- 公司地址:地址:span阜通东大街宝能中心A1308