宜昌 [切换城市] 宜昌招聘宜昌互联网/电子商务/网游招聘宜昌互联网软件开发工程师招聘

神马搜索-UC头条爬虫和页面分析提取研发工程师 (职位编号:GP034863)

阿里巴巴集团

  • 公司规模:10000人以上
  • 公司性质:上市公司
  • 公司行业:互联网/电子商务

职位信息

  • 发布日期:2017-02-03
  • 工作地点:北京
  • 招聘人数:1人
  • 工作经验:3-4年经验
  • 学历要求:本科
  • 职位类别:互联网软件开发工程师  

职位描述

职位描述:
负责大规模文本、图像、视频、音频、APP等数据的抓取、结构化信息抽取、内容分析、垃圾过滤、质量识别等工作。
建设良性的UC头条内容生态体系

工作职责:
1. 爬虫、结构化提取和内容分析相关功能开发
2. 爬虫、结构化提取和内容分析相关工具平台的研发

1. 本科以上 从事java/C++开发2~5年以上
2. 熟悉linux开发环境,熟练使用shell/python/perl/awk等至少一种脚本编程
3. 具备强悍的编码能力、扎实的数据结构和算法功底
4. 理解http协议,熟悉html,DOM,xpath
5. 熟悉抓取和页面解析类库,能进行页面结构化数据提取
6. 有数据挖掘相关经验,能够使用hadoop、storm、spark等相关平台
7. 工作认真细致踏实,有较强的学习能力

职能类别: 互联网软件开发工程师

举报 分享

公司介绍

阿里巴巴集团的使命是让天下没有难做的生意。

我们旨在赋能企业改变营销、销售和经营的方式。我们为商家、品牌及其他企业提供基本的互联网基础设施以及营销平台,让其可借助互联网的力量与用户和客户互动。我们的业务包括核心电商、云计算、数字媒体和娱乐以及创新项目和其他业务。我们并通过子公司菜鸟网络及所投资的关联公司口碑,参与物流和本地服务行业,同时与蚂蚁金融服务集团有战略合作,该金融服务集团主要通过中国领先的第三方网上支付平台支付宝运营。

我们的愿景
我们旨在构建未来的商务生态系统。我们的愿景是让客户相会、工作和生活在阿里巴巴,并持续发展最少102年。

联系方式

  • Email:yjw@alibaba-inc.com