深圳招聘计算机体系结构 C/C++

计算机体系结构 C/C++

英伟达半导体（上海）有限公司(NVIDIA)

公司规模：10000人以上
公司性质：外资（欧美）
公司行业：电子技术/半导体/集成电路

职位信息

发布日期：2019-01-30
工作地点：上海
招聘人数：若干人
工作经验：无工作经验
学历要求：招若干人
语言要求：不限
职位类别：软件工程师高级软件工程师

职位描述

工作地点：上海或新竹

工作职责：
? 针对架构和算法特征开发汇编级或者CUDA代码
? 优化cuBlas、cuDNN、TensorRT的核心kernel；
? 针对未来GPU架构开发原型代码，推进下一代架构的设计和优化；

基本要求：
? 严谨的逻辑思维和分析能力
? 较强编程能力(C/C++)、算法分析和实现

加分项：
? 熟悉计算机体系结构优先
? 有CUDA代码调优经验（或者SIMD等架构的调优经验）优先
? 熟悉矩阵计算的优化和加速优先

详细JD如下

Deep Learning Performance Architect - Shanghai, Hsinchu

Are you obsessed with performance? Do you like to work at the intersection of hardware and software? Do you live and breathe deep learning? NVIDIA is seeking world class programmers and performance architects who love to squeeze out every cycle of performance from deep learning codes. In this role, you will write code that ships in our deep learning libraries, as well as guide the direction of our future GPU architectures. This position offers the opportunity to have real impact in a fast-moving, technology-focused company.

What you'll be doing:
? Develop state of the art, performance critical code to accelerate deep learning on NVIDIA's platforms.
? Develop innovative HW, DSP, GPU and system architectures to extend the state of the art in deep learning performance and efficiency
? Analyze and prototype key deep learning and data analytics algorithms and applications
? Understand and analyze the interplay of hardware and software architectures on future algorithms and applications
? Collaborate across the company to guide the direction of machine learning, working with software, research and product teams

What we need to see:
? MS or PhD in relevant discipline (CS, EE, Math)
? Track record of optimizing code for performance on CPUs or GPUs, including assembly or SIMD programming
? Strong mathematical foundation in machine learning and deep learning
? Experience working with deep learning frameworks like Caffe, TensorFlow and Torch
? Strong programming skills in C, C++, Perl, or Python
? Familiarity with GPU computing (CUDA, OpenCL, OpenACC) and HPC (MPI, OpenMP)
? Strong background in computer architecture
? Experience with matrix multiply and convolution algorithms

职能类别：软件工程师高级软件工程师

公司介绍

关于NVIDIA-AI 计算公司中的领导者

1999 年，NVIDIA 发明了 GPU-这极大地推动了 PC 游戏市场的发展，重新定义了现代计算机图形技术，并彻底改变了并行计算。最近，GPU 深度学习为现代 AI 这个新的计算时代带来了新动力 - GPU 在能够感知和理解世界的计算机、机器人和自动驾驶汽车中发挥着大脑的作用。

超强计算性能
为这个时代的达芬奇和爱因斯坦们提供超强计算性能
我们开创性地开发出一种超强计算形式，深受全世界对计算机有超高要求的用户的青睐，包括科学家、设计师、艺术家和游戏玩家。对于他们而言，我们的创造几乎可媲美时间机器。
基于对更优质 3D 图形永无止境的需求以及当下庞大的游戏市场，NVIDIA 已在这个虚拟现实、高性能计算和人工智能的交叉口，将 GPU 发展为计算机大脑。

GPU 计算时代
已然来临
摩尔定律在过去的30年里被证明是正确的，因为当时微处理器的性能每年会提升 50%。但是，半导体物理学的局限意味着如今 CPU 性能每年只能提升 10%。
NVIDIA GPU 计算已为行业开启崭新的道路，到 2025 年，计算性能将提升至现有水平的 1000 倍。

NVIDIA 定义了现代计算机图形
我们于 1999 年研发的 GPU 将实时可编程着色技术变为现实，为艺术家提供了无限的调色板，供其挥洒创意。之后，我们一直引领着视觉计算领域的发展。

GEFORCE - 世界***大游戏平台
计算机游戏业的产值高达 1000 亿美元，已成为世界***大娱乐产业，而 NVIDIA GeForce 是该产业的***平台。GeForce？ GTX GPU 和 GeForce Experience？应用程序可将日常 PC 转变成强大的游戏机。我们的 GameWorks？软件允许开发者制作出更为逼真和引人入胜的游戏。

助力世界上运行速度最快的超级计算机
GPU 计算已成为高性能计算和数据中心的发展方向。NVIDIA 助力世界上运行速度最快的超级计算机，并为欧洲和日本***的系统提供支持。位于美国的 Summit 是目前世界上最智能、功能***大的超级计算机，具备超过每秒 200 千万亿次浮点运算的高性能计算性能和 3 exaOPS 的 AI 计算性能。Summit 融合了高性能计算和 AI，搭载了 27000 多个 NVIDIA Volta Tensor Core GPU 以运行计算，可加速科学发现的进程。

AI 时代
三种融合的力量推动了 AI 时代的到来：海量的可用数据、深度学习算法的发明和 GPU 计算的高性能。
新型互联网服务（如 Google Assistant）已学会了语音对话。自动驾驶汽车利用深度学习识别其占据的空间和需要避开的障碍物。就医疗健康领域而言，以数百万医学影像训练的神经网络可在 MRI 影像中捕捉到病因的蛛丝马迹，而人类目前只能凭借侵入性活检才能识别病因。
AI 将会大大促进社会蓬勃发展，这是之前任何一次工业革命都无法比拟的。

AI 汽车的大脑
自动驾驶车辆将革新市值高达 10 万亿美元的交通运输行业。NVIDIA DRIVE？是一个可扩展的 AI 汽车平台，可实现自动驾驶领域的全覆盖。从汽车公司和供应商到初创公司和研究组织，全球已有超过225 家公司和机构采用该汽车平台。

智能机器和物联网的大脑
深度学习和价格合理的传感器为自主机器（即配备 AI 的物联网）的迅猛发展创造了绝佳条件。NVIDIA Jetson TX2 是一台嵌入式 AI 超级计算机，信用卡大小的模块可提供万亿次级的计算性能。如此强大的性能将实现制造业新一轮的自动化浪潮，支持无人机探索危险地带，以及让机器人每天投递数百万的包裹。

激励着我们回报社会
NVIDIA 全球员工总数接近 12000 名，其中硅谷员工约有 5000 名，他们均怀有强烈的企业责任感。2017 年，我们的慈善捐赠总额已超过 600 万美元。

时至今日，NVIDIA 基金会的“Compute the Cure”计划已为抗癌事业提供超过 400 万美元的资助。此外，我们的“Techsplorer”计划为服务水平落后地区的青少年普及 AI 知识；自 2017 年启动以来，该计划已使超过 5,800 名学生受益。

联系方式