采集项目经理
万库标杆科技有限公司
- 公司规模:50-150人
- 公司性质:民营公司
- 公司行业:计算机软件
职位信息
- 发布日期:2019-06-17
- 工作地点:北京-海淀区
- 招聘人数:3人
- 工作经验:3-4年经验
- 学历要求:本科
- 职位月薪:1.8-2.4万/月
- 职位类别:大数据开发/分析 项目经理
职位描述
业务工作:
1.遵守部门业务流程/规范并认真执行;
2.负责项目组采集需求验收,对验收结果整体负责;
3.负责解决采集防抓取、异步加载等技术难点,编写复杂种子/数据采集脚本;
4.负责采集任务的资源需求测算、回滚策略制定和任务上线申请;
5.负责采集脚本上线冒烟测试,保证测试结果正确;
6.负责各线上采集任务的进度、质量、数量及更新情况检查,及时发现问题并解决;
7.负责解决网站改版、需求变更等情况产生的脚本、种子、数据、资源的变更问题;
8.负责采集及更新过程的状态监控,及时分析异常并解决,按时输出统计分析报告;
9.负责制定采集任务的数据更新周期及更新策略并落实;
10.负责采集数据的清洗(如去脏数据、清理标签等)、规整(如规范省市名称等)、标准化(如日期电话格式化等)、归一及特征属性的提取、分析;
11.参与采集系统的技术开发,基于问题,持续提出对采集系统优化方案;
管理工作:
1.负责根据公司/部门任务目标,按月制定项目计划,推动项目立项、实施、交付全过程;
2.负责整体把控项目计划各节点的数量、质量、进度、风险和成本,解决难点/关键点,组织/协调所需资源,推动各小组按计划输出成果,保证项目交付成功;
3.负责在项目计划各节点对项目全员进行绩效考核,按月输出绩效考核表;
4.负责以问题为牵引,持续建设、完善部门、项目的业务流程/规范/制度;
5.及时发现问题、解决问题并记录至问题跟踪表,定期将项目问题汇总并上传到知识库;
6.负责将问题整理成培训案例,对项目组全员进行业务培训、业务指导、纠错纠偏;
7.负责项目组团队组建(招聘)、业务骨干培养,企业文化宣贯及落实;
8.遵守公司管理制度,认同公司企业文化,接受绩效考核;
9.承接上级领导交办的临时任务,配合跨部门工作。
任职条件要求:
专业
1.计算机、信息管理相关专业,本科及以上学历;
2.掌握项目管理专业知识;
3.系统的大数据理论知识;
技能
1.精通正则表达式、Javascript、JSON;
2.精通Python、Scrapy、Ajax请求过程;
3.熟悉HTTP协议(POST、GET、Header信息)、URL编解码;
4.熟悉网页DOM结构、CSS选择器、JQUERY;
5.熟悉Linux Shell脚本和命令(grep、awk);
6.熟悉Mysql数据库分表、分库及SQL语句;
7.熟悉Hadoop生态圈(hdfs、hbase、hive、spark、zookeeper、kafka等);
8.熟练使用Git、SVN、禅道、NotePad++、Excel、Word、Chrome浏览器控制台、Navicat、VNC、SSH等工具;
项目经验
1.有3年及以上的数据采集经验;
2.有文献、新闻、商品、图片、音视频或国外数据抓取采集经验;
3.丰富的代理、验证码、图片识别、登录验证等防抓取解决经验;
4.有采集系统架构设计、开发经验;
管理经验
1.有1年及以上项目管理及风控经验;
2.熟悉基于SOP的现代化公司管理制度;
3.有业务、项目流程/规范/制度建设、完善经验优先;
4.有团队组建(招聘)经验;
5.有PMP认证者优先;
价值观
1.对工作严谨、专注、勤勉;
2.责任心强、正直、忠诚、有担当;
3.认同以客户为中心,责任结果为导向、以问题为牵引的流程化、制度化、精细化管理,质量至上;
4.有团队精神、高度配合、善于协作,乐于分享、优化创新;
综合素质(能力/思维模式)
1.有推动力、执行力、计划力、组织力、控制力、指挥力,能带领团队完成任务;
2.有较好的维度思维、层级思维、逻辑思维、系统思维;
3.高度的服务意识和大局观意识;
4.安全保密、忠于职守;
公司介绍
万库标杆科技有限公司是中关村科技园区高新技术企业,注册资本1亿元人民币,历经22年, 秉承科学精神与匠人精神,致力于963个行业跨领域/跨行业知识图谱和知识引擎研发,在大数据、人工智能等领域提供产品与应用。
基础—963行业/学科语义知识图谱 (国家工程):
邀请了1100家科、研、院、所(中科院、社科院、清华、北大、国家图书馆等单位),9万多名专家参与,参考6万多种工具书,共同完成了目前全球最大,覆盖134个领域、963个行业、3.2亿主题的跨领域/跨行业知识图谱,覆盖中英文双语种。通过自适应、自学习核心算法实现跨领域/跨行业知识图谱的实时更新变化。被列为国家信息资源开发利用试点工程,并被颁布为国家标准和行业标准。
核心—数据到信息、信息到知识、知识到知识图谱:
以跨领域/跨行业知识图谱为核心基础,通过数据到信息、信息到知识、知识到知识图谱三大核心环节,建立知识关联,实现知识网状关联拓展。
应用—知识图谱搜索平台:
通过大数据建模、深网采集、数据语义处理、数据关联挖掘、关联索引、语义检索六大模块及语义关联算法体系,构建跨领域/跨行业知识图谱搜索平台。
产品—智能化、个性化知识图谱搜索服务:
为企业、科研院所、高等院校、个人等提供智能化、个性化知识图谱搜索服务,改变人们的知识获取方式(人找信息变成信息找人)和认知方式(多维度/多领域认知)。
个性化定制和知识付费已成为趋势,万库标杆专注于将知识使用、知识发现到知识创造变成财富。
企业文化 — 关联万物、重构价值
基础价值观:以(内/外)客户为中心;
以问题为牵引;
以责任结果为导向;
核心价值观:勤勉、严谨、专业 极致、卓越、使命;
正直、担当、专注 坚毅、奉献、忠诚;
素 质:学习力、沟通力、主动性、意志力、执行力;
计划力、组织力、协作力、领导力、控制力;
思 维:逻辑思维、系统思维、创新思维;
求贤标准 — 专业、专注
树立客户意识、团队意识、规则意识、专业意识和危机意识;
通过强大的执行力、学习力、担当力;
实现责任感、成就感、归属感和使命感。
您选择的不仅是一份工作而是一种价值观、思维模式、工作方式、甚至生活习惯!
让我们成为事业共同体、命运共同体、利益共同体!
汇众智、聚众力!
联系方式
- Email:hr@onecooo.com
- 公司地址:地址:span王庄路1号清华同方科技广场D座