网络爬虫工程师 (职位编号:nbug)
信号旗智能科技(上海)有限公司
- 公司规模:少于50人
- 公司性质:民营公司
- 公司行业:计算机软件
职位信息
- 发布日期:2016-12-03
- 工作地点:上海-浦东新区
- 招聘人数:2人
- 工作经验:2年经验
- 学历要求:本科
- 语言要求:英语 良好
- 职位月薪:8000-12000/月
- 职位类别:算法工程师 软件工程师
职位描述
职位描述:
公司研发基地设在上海张江阿里巴巴创新基地,工作氛围轻松,在工作中可以学习并接触到计算机视觉、自然语言处理、机器学习,弹性工作制,给每个人公平的发展机会与上升通道。我们希望所有加入信号旗的员工都能有一次改变命运的机会,一次个人成长飞跃的机会、一次改变个人经济的机会、一次将打工变为创业的机会。
职位描述
1)参与爬虫系统的数据抓取、架构设计与开发;
2)负责信息抽取、数据清洗等研发和优化工作;
3)参与爬虫核心算法的策略优化研究,提升网页抓取的效率和质量。
任职资格:
1)计算机、数学或者统计学相关专业本科或以上学历,具有实际项目经验;
2)熟悉linux平台开发,掌握Python/C++/Java三种编程语言中的至少一种,熟练掌握常用数据结构和算法;
3)精通正则表达式,各类序列化、反序列化模型,有从半结构化文本、短文本中抽取信息经验者优先;
4)熟悉爬虫、熟悉HTML/CSS/JavaScript,了解Bootstrap,能用js脚本编写前端界面;
5)具有PHP或Python网站开发经验者优先,具有自然语言处理、信息抽取经验者优先
举报
分享
公司研发基地设在上海张江阿里巴巴创新基地,工作氛围轻松,在工作中可以学习并接触到计算机视觉、自然语言处理、机器学习,弹性工作制,给每个人公平的发展机会与上升通道。我们希望所有加入信号旗的员工都能有一次改变命运的机会,一次个人成长飞跃的机会、一次改变个人经济的机会、一次将打工变为创业的机会。
职位描述
1)参与爬虫系统的数据抓取、架构设计与开发;
2)负责信息抽取、数据清洗等研发和优化工作;
3)参与爬虫核心算法的策略优化研究,提升网页抓取的效率和质量。
任职资格:
1)计算机、数学或者统计学相关专业本科或以上学历,具有实际项目经验;
2)熟悉linux平台开发,掌握Python/C++/Java三种编程语言中的至少一种,熟练掌握常用数据结构和算法;
3)精通正则表达式,各类序列化、反序列化模型,有从半结构化文本、短文本中抽取信息经验者优先;
4)熟悉爬虫、熟悉HTML/CSS/JavaScript,了解Bootstrap,能用js脚本编写前端界面;
5)具有PHP或Python网站开发经验者优先,具有自然语言处理、信息抽取经验者优先
职能类别: 算法工程师 软件工程师
关键字: 自然语言处理 语义 语料 机器学习 算法 语义分析 数据挖掘 文本挖掘 短文本
公司介绍
信号旗智能能科技(上海)有限公司是于2016年8月成立自贸实验区。
我们的目标----让外贸更加简单
AIport国际贸易单证智能口岸通关系统集成了ASE图像知识获取内核与传统的人工制单、录入、审单相比不仅可以极大的提升速度、精度,更可实现机器替代专业关务员、报关员。同时AIport内嵌了《国际贸易便利化标准化》校验模块,可根据中国商务部的“国际贸易单证标准化”与联合国“UN/CEFACT国际贸易便利化措施体系标准”对货主单位的单证进行标准化校验,避免因标准化问题引起的通关壁垒。
我们希望在未来的3-5年内,能让越来越多的进出口企业使用我们的平台进行进出口业务操作,能真实的降低每票业务的成本,能真实的缩短每次操作的时间,能用国际标准化来规范每份单证避免贸易损失。
我们的技术----全知之眼图像知识获取解码器
信号旗智能科技以全知之眼(All-Seeing Eye,ASE)图像知识获取解码器为核心,利用计算机视觉理论模型和深度学习,实现对图像复杂版面逻辑结构的理解和分析,通过源编码层获取表示图像的抽象编码将图像反编译为标识性置标语言。 在图像知识获取层,系统与基于注意力模型的标注解码器(ABED)和基于领域本体与知识推理的语义分析模型进行级联,对反编译结果中的文本知识进行深度解析,从而将国际贸易中涉及的各类纸质单证扫描图像直接转化为报关、报检所需的标准报文。
AIport系统集成了ASE图像知识获取内核可实现全自动的由纸质原始单证到报关、报检的工作。该系统模型采用一种全新的数据驱动的方法,不依赖任何关于底层标记语言的知识或者贸易单证及报关报检的知识,仅对现实世界样本单证进行端对端的训练处理,不需要指定工程领域,广泛适应于各类数据库。为了训练和评估模型,我们引入了与标识性置标语言的标记配对,完美再现了纸质票据单证文档的新数据集以及与标记语言匹配的语义合成数据集。实验结果表明,AIport系统在为数据集生成准确标记以及知识解析提取方面有显著的成效,在数据集中对99%的原始纸质文件成功进行再现和知识获取。
2017-03-29
获首届云上创新创业案例评选Top20之技术突破奖
信号旗智能科技团队在历经为期4个月的三轮晋级赛后,从全国600多个案例中脱颖而出。信号旗智能科技凭借人工智能产品全知之眼(All-Seeing Eye,ASE)图像知识获取解码器,荣获最具技术突破奖。
">
2017年阿里云计算举办的云栖大会·深圳峰会在深圳顺利举行,其中“云创新势力”首届云上创新创业案例评选Top20创业榜单于3月29日创新创业分论坛重磅揭晓,信号旗智能科技团队在历经为期4个月的三轮晋级赛后,从全国600多个案例中脱颖而出。信号旗智能科技凭借人工智能产品全知之眼(All-Seeing Eye,ASE)图像知识获取解码器,荣获最具技术突破奖。
我们的目标----让外贸更加简单
AIport国际贸易单证智能口岸通关系统集成了ASE图像知识获取内核与传统的人工制单、录入、审单相比不仅可以极大的提升速度、精度,更可实现机器替代专业关务员、报关员。同时AIport内嵌了《国际贸易便利化标准化》校验模块,可根据中国商务部的“国际贸易单证标准化”与联合国“UN/CEFACT国际贸易便利化措施体系标准”对货主单位的单证进行标准化校验,避免因标准化问题引起的通关壁垒。
我们希望在未来的3-5年内,能让越来越多的进出口企业使用我们的平台进行进出口业务操作,能真实的降低每票业务的成本,能真实的缩短每次操作的时间,能用国际标准化来规范每份单证避免贸易损失。
我们的技术----全知之眼图像知识获取解码器
信号旗智能科技以全知之眼(All-Seeing Eye,ASE)图像知识获取解码器为核心,利用计算机视觉理论模型和深度学习,实现对图像复杂版面逻辑结构的理解和分析,通过源编码层获取表示图像的抽象编码将图像反编译为标识性置标语言。 在图像知识获取层,系统与基于注意力模型的标注解码器(ABED)和基于领域本体与知识推理的语义分析模型进行级联,对反编译结果中的文本知识进行深度解析,从而将国际贸易中涉及的各类纸质单证扫描图像直接转化为报关、报检所需的标准报文。
AIport系统集成了ASE图像知识获取内核可实现全自动的由纸质原始单证到报关、报检的工作。该系统模型采用一种全新的数据驱动的方法,不依赖任何关于底层标记语言的知识或者贸易单证及报关报检的知识,仅对现实世界样本单证进行端对端的训练处理,不需要指定工程领域,广泛适应于各类数据库。为了训练和评估模型,我们引入了与标识性置标语言的标记配对,完美再现了纸质票据单证文档的新数据集以及与标记语言匹配的语义合成数据集。实验结果表明,AIport系统在为数据集生成准确标记以及知识解析提取方面有显著的成效,在数据集中对99%的原始纸质文件成功进行再现和知识获取。
2017-03-29
获首届云上创新创业案例评选Top20之技术突破奖
信号旗智能科技团队在历经为期4个月的三轮晋级赛后,从全国600多个案例中脱颖而出。信号旗智能科技凭借人工智能产品全知之眼(All-Seeing Eye,ASE)图像知识获取解码器,荣获最具技术突破奖。
">
2017年阿里云计算举办的云栖大会·深圳峰会在深圳顺利举行,其中“云创新势力”首届云上创新创业案例评选Top20创业榜单于3月29日创新创业分论坛重磅揭晓,信号旗智能科技团队在历经为期4个月的三轮晋级赛后,从全国600多个案例中脱颖而出。信号旗智能科技凭借人工智能产品全知之眼(All-Seeing Eye,ASE)图像知识获取解码器,荣获最具技术突破奖。
联系方式
- 公司地址:地址:span纳贤路800号