NVIDIA 助力蔚来构建移动计算平台
云栖网:当今越来越多的行业朝着智能化方向转移,拥有百年历史的汽车行业也不例外。汽车制造商、供应商、初创公司等正接受着这股浪潮的洗礼,向自动驾驶时代前进。
蔚来是一家全球化的智能电动汽车公司,于 2014年 11月 25日正式成立。蔚来致力于通过提供高性能的智能电动汽车与极致用户体验,为用户创造愉悦的生活方式。蔚来采用了NVIDIA DRIVE Orin 系统级芯片构建自主研发的新一代自动驾驶平台,其在智能电动汽车领域始终保持领先的自动驾驶研发水平,满足软件定义车辆的 AI 基础架构和车内计算需求。
图片来源于蔚来
自动驾驶面临算力挑战
自动驾驶汽车的开发是一项需要大量加速计算基础架构的计算密集型工作。为了在更多场景中为用户提供极致的驾乘体验,完成更高等级的自动驾驶算法落地,软件定义汽车需要实现冗余、配置多种高分辨率传感器并应用深度神经网络。这些因素都将带来对强大计算能力的需求,以便能够处理所有 AI 工作负载。
另外,研发所用的数据采集车每年会产生百 PB 级别的数据以及几十亿张图像,量产车也需要回流海量的道路数据,用于优化算法模型,这意味着车企的数据中心需要具备回流、筛选和标注海量用于 AI 模型训练的数据的能力。
成功的规模化技术应用离不开稳健的技术基础架构,包括覆盖全场景链路的人工智能平台和大规模机器学习系统在内,蔚来汽车采用NVIDIAGPU自主研发了一整套自动驾驶基础架构体系,支持复杂的深度学习模型迭代以及全流程快速迭代,为自动驾驶算法闭环提供坚实支撑。
NVIDIA 赋能超级计算机
蔚来的超级计算机由 NVIDIA HGX A100 8-GPU 和 NVIDIA Mellanox InfiniBand ConNECtX-6 构建。超级计算机集群包括超级计算机和搭配 NVIDIA Mellanox InfiniBand ConnectX-6 的高性能 NVME SSD 服务器,通过 NVIDIA Mellanox InfiniBand 高速网络相连,且规模不断扩大。
通过合理使用 NVIDIA Multi-Instance GPU,使得算法工程师在开发过程中的工作效率和集群资源利用率得到了巨大提升。同时,蔚来在 NVIDIA NVLink 和 NVIDIA Mellanox InfiniBand 的基础上构建了支持多卡和多机训练的深度学习训练框架,使用 NVIDIA Mellanox InfiniBand 和基于 NVIDIA Mellanox InfiniBand 的 RDMA 技术,构建了分布式的高性能文件读取加速套件。在数据驱动应用的场景下,使得大量的深度学习训练数据能够以高达 200 Gbps 的超高速率零拷贝传输至超级计算机内存或 NVIDIA A100 显存中,进一步稳固了自动驾驶平台的基础服务架构。
另外,每个端上配备 4 颗NVIDIA DRIVE Orin 系统级芯片,具备 8096 个 CUDA 核心,为量产车提供了前所未有的超 1000 TOPS 算力。DRIVE Orin系统级芯片集成了 NVIDIA Ampere 架构和 Arm Hercules CPU 内核以及全新深度学习和计算机视觉加速器,总计每秒可运行超过 254 万亿次计算,几乎是 NVIDIA上一代 Xavier 系统级芯片性能的 7 倍。Orin可处理在自动驾驶汽车内同时运行的大量应用和深度神经网络,并且达到了 ISO 26262 ASIL-D 等系统安全标准。
借助DRIVE Orin强大的性能优势,蔚来能够为安全的自动驾驶功能提供所必需的冗余和灵活性,让驾乘体验安心舒适。
蔚来的首款轿车ET7 是具备自动驾驶能力的智能电动旗舰轿车。ET7 应用了最新的蔚来自动驾驶技术NAD(NIO Autonomous Driving)。蔚来超算平台Adam搭载四颗NVIDIA DRIVE Orin,算力高达1016TOPS,是迄今为止最强大的量产移动计算平台。蔚来建立了全栈自动驾驶技术能力,将逐步实现高速、城区、停车、加电等场景下轻松安全的点到点自动驾驶体验。
加速自动驾驶产品落地
NVIDIA HGX A100 是适用于庞大数据集、复杂模型等 AI 场景的加速服务器平台。HGX A100 整合 NVIDIA Ampere GPU、NVIDIA NVLink、NVIDIA Mellanox InfiniBand 网络及在 NGC(NVIDIA GPU Cloud)中经全面优化的 NVIDIA AI 软件堆栈。同时,它树立了新的计算密度标杆,将 5 PETAFLOPS 的 AI 性能浓缩,并用一个平台取代了各种 AI 工作负载的传统孤岛式基础架构。借助 HGX A100,蔚来以纵向扩展和横向扩展方式自由搭建并应用 AI 平台,也让蔚来的模型开发效率提高了 20 倍,帮助蔚来更快的落地自动驾驶产品,向更新更快的架构演进。
另一方面,NVIDIA DGX POD 参考架构结合 NVIDIA 加速计算架构、Mellanox 网络架构和系统管理软件。基于此,蔚来实现了提供使超级计算能力大众化的解决方案,使超级计算能力变得易于访问、安装和管理,从而满足自动驾驶复杂架构的需求。
高性能 AI 计算是蔚来汽车自动驾驶技术的重要组成部分,在NVIDIADRIVE端到端解决方案的强力支持下,蔚来可以通过庞大的道路实际数据来演进设计新的自动驾驶功能,持续为车主提供安心的驾驶体验。
NVIDIA致力于提供领先的技术和解决方案,帮助汽车制造商加速开发和软件定义汽车的生产落地。
蔚来 AI 平台负责人白宇利表示:“量产车面临的复杂场景是蔚来自动驾驶能力的试金石,同时,量产车产生的海量数据也是也是蔚来自动驾驶能力护城河。NVIDIA的高性能计算解决方案,成为了蔚来在自动驾驶这条道路上的加速器。”
关于NVIDIA
NVIDIA(纳斯达克股票代码:NVDA)在1999年发明的GPU激发了PC游戏市场的增长,重新定义了现代计算机显卡、高性能计算和人工智能。NVIDIA公司在加速计算和人工智能领域的创新研究成果正在改变交通运输、医疗、制造等万亿美元级行业,并推动许多其他行业的发展。