Software Engineer (Data Crawling)
上海集博投资管理咨询有限公司
- 公司规模:50-150人
- 公司性质:外资(欧美)
- 公司行业:制药/生物工程
职位信息
- 发布日期:2012-09-07
- 工作地点:上海-黄浦区
- 招聘人数:若干
- 工作经验:一年以上
- 学历要求:本科
- 语言要求:英语良好
普通话良好 - 职位类别:高级软件工程师
职位描述
Key responsibilities:
1 Design and develop data crawling and parse systems for the data cycle.
2 Build a set of monitors on the routine grab parse systems.
3 Leverage the power of AWS cloud (Amazon Web Services) to operate and maintain such systems.
Basic requirements:
1 Love of data, and more love of big data
2 English and Chinese language ability
3 Familiar with http protocol and http server logics.
4 Familiar with html, xml protocols.
5 Love of hacking the third party http servers.
6 Experience of programming in java.
7 Good knowledge of database.
8 Familiar with data protocols such as JSON, xml.
Preferred points:
1 Command of Linux Shell, ssh, github will be a plus.
2 Use of Jsoup library to build html parsers.
3 Use of apache http client library to build web crawlers.
4 Experience of using NoSQL database will be a plus (mongodb, redis, Amazon SimpleDB, Memcache).
5 Experience of distributed computing or using such open source tools (such as zookeeper) will be a plus.
6 Experience of web development using python, php, js will be a big plus.
7 Familiar with concept of SOA (service oriented architect) and AWS Cloud will be a plus.
公司介绍
目前,GBI的产品及服务主要涵盖两个方面:信息与洞察产品、数据与分析服务。信息与洞察产品包括三个不同类型的数据库:SOURCE、DEVINT、METRIX。
◆ SOURCE 医药竞争情报在线数据库
为医药行业的专业人士提供行业新闻、数据情报、分析工具,帮助企业作出以数据为驱动的关键决策。
◆ DEVINT 医疗器械竞争情报在线数据库
整合了产品、公司、市场等方面的数据,并通过分析工具、及时的行业政策与新闻帮助企业作出以数据为驱动的关键决策。
◆ METRIX KOL医学专家在线数据库
医疗行业专业人士筛选、追踪 KOL医学专家,更为高效寻求合作者,便捷地让研发人员掌握药物的研发状况,市场营销人员策划与执行市场推广方案将更为精准有效。
作为一个值得信赖的情报提供者,GBI与跨国公司及国内企业建立了长期的密切合作关系,共同推动医疗保健行业持续向前发展。目前公司客户覆盖95%以上跨国药企、中国创新药企业、咨询公司及投资公司。
联系方式
- 公司地址:地址:span朝阳区光华东里8号中海广场世鳌国际