NVIDIA 推动全球领先的深度学习计算平台进一步发展，六个月内实现10倍性能提升

云栖网 2018-03-28 09:55 来源：云栖网

云栖网：加利福尼亚州圣何塞—GPU技术大会—太平洋时间2018年3月27日—NVIDIA今日公布了其全球领先的深度学习计算平台所取得的一系列重要进展，相较于六个月前发布的上一代产品，其深度学习工作负载性能实现了10倍提升。

NVIDIA的平台已被各大云计算服务提供商和服务器制造商所采用，此次公布的主要进展包括NVIDIA®Tesla®V100（最强大的数据中心GPU）的2倍内存提升，以及革命性的全新GPU互联结构NVIDIANVSwitch™，它可使多达16个TeslaV100GPU同时以2.4TB/秒的速度进行通信，这一速度创下历史新高。NVIDIA还推出了一个更新的、全面优化的软件堆栈。

此外，NVIDIA推出NVIDIADGX-2™，是其在深度学习计算领域取得的重大突破。这是首款能够提供每秒两千万亿次浮点运算能力的单点服务器。DGX-2具有300台服务器的深度学习处理能力，占用15个数据中心机架空间，而体积则缩小60倍，能效提升18倍。

NVIDIA创始人兼首席执行官黄仁勋在GTC2018上公布了这一消息，他表示：“深度学习的超凡进展仅仅是对未来的启示。其中的很多进展都是基于NVIDIA深度学习平台，该平台已快速成为全球标准。我们正在以大幅超越摩尔定律的步伐加快提升平台的性能，以实现突破，进而为医疗保健、交通运输、科学探索和其他众多领域带来革命性改变。“

TeslaV100实现内存翻倍

TeslaV100GPU被全球领先的研究人员广为采用，2倍的内存提升使其能够处理大部分内存密集型深度学习和高性能计算工作负载。

如今TeslaV100GPU配备了32GB内存，将助力数据科学家对更深度、更大规模的深度学习模型进行训练，且比以往都更加精确。与之前的16GB版本相比，它还能将内存受限的HPC应用性能提升高达50％。

TeslaV10032GBGPU目前可用于所有NVIDIADGX系统。此外，各大计算机制造商Cray、HPE、IBM、联想、Supermicro和Tyan也宣布将于第二季度内推出各自全新的TeslaV10032GB系统。

Oracle云基础设施也宣布计划将于今年下半年在云端提供TeslaV10032GB。

NVSwitch:革命性的互联结构

NVSwitch的带宽比最好的PCIe交换机高出5倍，让开发者能够采用更多的超级互联GPU来构建系统。它将帮助开发者突破早前系统的限制并运行更大的数据集。它也为更大规模、更复杂的工作负载开启了可能，包括神经网络并行训练的建模。

NVSwitch在NVIDIANVLink™（NVIDIA开发的首款高速互联技术）的创新基础上实现了进一步扩展，让系统设计人员能够构建更高级的系统，进而灵活地连接任何基于NVLink的GPU的拓扑结构。

先进的GPU加速深度学习和HPC软件堆栈

NVIDIA深度学习和HPC软件堆栈的更新面向开发者社群免费提供。当前开发者社群共有超过82万名注册用户，而一年前约为48万。

此次更新包括新版本的NVIDIACUDA®、TensorRT、NCCL和cuDNN，以及面向机器人的全新Isaac软件开发套件。此外，通过与领先云服务提供商的密切合作，各大主流深度学习框架都在持续优化，以充分利用NVIDIA的GPU计算平台。

NVIDIADGX-2：全球首款性能高达每秒2千万亿次浮点运算的系统

NVIDIA新推出的DGX-2系统通过借鉴NVIDIA为所有层级的计算堆栈开发的各种业界领先的技术优势，实现了每秒2千万亿次浮点运算的里程碑式突破。

DGX-2是首款采用NVSwitch的系统，其中采用的16个GPU均共享统一的内存空间。这让开发者获得了相应的深度学习训练能力，以处理最大规模的数据集和最复杂的深度学习模型。

DGX-2结合了全面优化更新的NVIDIA深度学习软件套件，旨在助力数据科学家突破深度学习研究和计算的外部极限。

DGX-2能够在不到两天的时间内完成对FAIRSeq的训练，FAIRSeq是一种采用最新技术的神经网络机器翻译模型，其性能相较于去年9月份推出的基于Volta架构的DGX-1提高了10倍。

TeslaV10032GB得到业界广泛支持

微软技术院士兼语音和语言业务负责人黄学东表示：“在过去几年中，微软和NVIDIA在AI技术方面的合作取得了巨大进展，包括最近在汉译英方面的突破。借助全新TeslaV10032GBGPU，我们将能够更快速地针对更大规模、更为复杂的AI模型进行训练。这将有助于提升自身语音识别模型和机器翻译模型的准确性，使其达到人类的水平，并强化Cortana、Bing和MicrosoftTranslator等产品。”

SAP以色列创新中心副总裁MichaelKemelmakher表示：“我们采用SAPBrandImpact这款能够近乎实时地对视频中的品牌曝光率进行自动化分析的应用，评估了搭载全新TeslaV10032GB的DGX-1。内存的升级提高了我们在较大的ResNet-152模型上处理更高清晰度图像的能力，将平均错误率降低40％，进而能够提供准确、及时且可审计的规模化服务。”

NVIDIADGX产品组合

DGX-2是NVIDIADGX产品组合中的最新产品。该组合由三个系统组成，旨在帮助数据科学家快速开发、测试、部署并扩展全新的深度学习模型及创新成果。

DGX-2搭载16个GPU，是该产品阵容中的佼佼者。该系列中的其它产品还包括采用8个TeslaV100GPU的NVIDIADGX-1系统，以及拥有紧凑型桌边式设计、采用4个TeslaV100GPU的全球首台个人深度学习超级计算机DGXStation™。这些系统使数据科学家能够将工作从运行于桌面的复杂实验，扩展至最高难度的深度学习问题，帮助他们全力完成工作。