采集组长
万库标杆科技有限公司
- 公司规模:50-150人
- 公司性质:民营公司
- 公司行业:计算机软件
职位信息
- 发布日期:2019-06-17
- 工作地点:北京-海淀区
- 招聘人数:5人
- 工作经验:3-4年经验
- 学历要求:本科
- 职位月薪:1.2-1.5万/月
- 职位类别:软件工程师 数据库工程师/管理员
职位描述
业务工作:
1.遵守部门业务流程/规范并认真执行;
2.负责小组采集需求验收,对验收结果整体负责;
3.负责审核小组采集任务在各环节输出成果的数量、质量、进度,解决业务难点/关键点;
4.负责解决采集防抓取、异步加载等技术难点,编写复杂种子/数据采集脚本;
5.负责采集任务的资源需求测算、回滚策略制定和任务上线申请;
6.负责采集脚本上线冒烟测试,保证测试结果正确;
7.负责线上采集任务的进度、质量、数量检查,及时发现问题并解决;
8.负责解决网站改版、需求变更等情况产生的脚本、种子、数据的变更问题;
9.负责采集及更新过程的状态监控,及时分析异常并解决,按时输出统计分析报告;
10.负责制定小组采集任务的数据更新周期及更新策略并落实;
11.基于问题,持续提出对采集系统优化方案;
管理工作:
1.负责根据部门任务目标,制定小组月工作计划,把控风险,推动小组全员按计划输出成果;
2.负责在工作计划各节点对小组全员进行绩效考核,按月输出绩效考核表;
3.负责以问题为牵引,持续优化、完善部门业务流程/规范/制度;
4.负责将问题整理成培训案例,对小组成员进行业务培训、业务指导、纠错纠偏;
5.及时发现问题、解决问题并记录至问题跟踪表,定期将小组问题汇总并上传到知识库;
6.负责小组团队组建、人才培养,企业文化宣贯及落实;
7.遵守公司管理制度,认同公司企业文化,接受绩效考核;
8.承接上级领导交办的临时任务。
任职条件要求:
专业
1.计算机、信息管理相关专业,本科及以上学历;
2.专业知识扎实者优先;
技能
1.精通图形化分析网页DOM结构、CSS选择器、JQUERY;
2.精通正则表达式、Javascript、JSON;
3.熟悉Python、Scrapy、Ajax请求过程;
4.熟悉HTTP协议(POST、GET、Header信息)、URL编解码;
5.熟悉Linux Shell脚本和命令(grep、awk)、基本SQL语句。
6.熟练使用Git、SVN、禅道、Chrome浏览器控制台、Navicat、VNC、SSH、NotePad++、Excel、Word等工具;
7.熟悉代理、验证码、图片识别、登录验证、人机识别等防抓取策略;
8.了解字符集及字符集转换(UTF-8、Unicode、GB2312);
项目经验
1.有3年及以上的数据采集经验;
2.有文献、新闻、商品、图片、音视频或国外数据抓取采集经验;
3.有代理、验证码、图片识别、登录验证等防抓取经验;
4.有采集系统开发经验者优先;
5.有大数据、知识图谱相关知识背景者优先;
管理经验
1.有1年及以上团队或项目管理经验;
2.熟悉基于SOP的现代化公司管理制度;
3.有团队组建(招聘)经验;
4.有业务、项目流程/规范/制度建设、完善经验优先;
5.有PMP认证者优先;
价值观
1.对工作严谨、专注、勤勉;
2.责任心强、正直、忠诚、有担当;
3.认同以客户为中心,责任结果为导向、以问题为牵引的流程化、制度化、精细化管理,质量至上;
4.有团队精神、高度配合、善于协作,乐于分享、优化创新;
综合素质(能力/思维模式)
1.有推动力、执行力、计划力、控制力,能带领团队完成任务;
2.有较好的维度思维、层级思维、逻辑思维、系统思维;
3.高度的服务意识和大局观意识;
4.安全保密、忠于职守;
职能类别: 软件工程师 数据库工程师/管理员
公司介绍
万库标杆科技有限公司是中关村科技园区高新技术企业,注册资本1亿元人民币,历经22年, 秉承科学精神与匠人精神,致力于963个行业跨领域/跨行业知识图谱和知识引擎研发,在大数据、人工智能等领域提供产品与应用。
基础—963行业/学科语义知识图谱 (国家工程):
邀请了1100家科、研、院、所(中科院、社科院、清华、北大、国家图书馆等单位),9万多名专家参与,参考6万多种工具书,共同完成了目前全球最大,覆盖134个领域、963个行业、3.2亿主题的跨领域/跨行业知识图谱,覆盖中英文双语种。通过自适应、自学习核心算法实现跨领域/跨行业知识图谱的实时更新变化。被列为国家信息资源开发利用试点工程,并被颁布为国家标准和行业标准。
核心—数据到信息、信息到知识、知识到知识图谱:
以跨领域/跨行业知识图谱为核心基础,通过数据到信息、信息到知识、知识到知识图谱三大核心环节,建立知识关联,实现知识网状关联拓展。
应用—知识图谱搜索平台:
通过大数据建模、深网采集、数据语义处理、数据关联挖掘、关联索引、语义检索六大模块及语义关联算法体系,构建跨领域/跨行业知识图谱搜索平台。
产品—智能化、个性化知识图谱搜索服务:
为企业、科研院所、高等院校、个人等提供智能化、个性化知识图谱搜索服务,改变人们的知识获取方式(人找信息变成信息找人)和认知方式(多维度/多领域认知)。
个性化定制和知识付费已成为趋势,万库标杆专注于将知识使用、知识发现到知识创造变成财富。
企业文化 — 关联万物、重构价值
基础价值观:以(内/外)客户为中心;
以问题为牵引;
以责任结果为导向;
核心价值观:勤勉、严谨、专业 极致、卓越、使命;
正直、担当、专注 坚毅、奉献、忠诚;
素 质:学习力、沟通力、主动性、意志力、执行力;
计划力、组织力、协作力、领导力、控制力;
思 维:逻辑思维、系统思维、创新思维;
求贤标准 — 专业、专注
树立客户意识、团队意识、规则意识、专业意识和危机意识;
通过强大的执行力、学习力、担当力;
实现责任感、成就感、归属感和使命感。
您选择的不仅是一份工作而是一种价值观、思维模式、工作方式、甚至生活习惯!
让我们成为事业共同体、命运共同体、利益共同体!
汇众智、聚众力!
联系方式
- Email:hr@onecooo.com
- 公司地址:地址:span王庄路1号清华同方科技广场D座