欢迎来到云栖网

免费注册

英伟达推出全新AI超级计算机,谷歌云、Meta和微软将为首批客户

云栖网 2023-05-30 14:31 来源:云栖网

英伟达推出全新AI超级计算机,谷歌云、Meta和微软将为首批客户


黄仁勋在COMPUTEX主题演讲上展示了多个新系统,软件及服务,以充分利用这个时代最具变革性的技术——生成式AI

云栖网5月29日消息,NVIDIA(也称“英伟达”)创始人兼首席执行官黄仁勋在 COMPUTEX 主题演讲中发布了多个平台。

在近两个小时的演讲中,他介绍了加速计算服务、软件和系统,它们正在推动实现新业务模式和提高当前业务模式效率。黄仁勋表示,“加速计算和AI标志着计算的革新”。

黄仁勋展示了一个文本提示,为他的主题演讲生成一首主题曲,可以像任何卡拉OK曲调一样演唱。黄仁勋说:“我们现在正处于一个全新计算时代的转折点,加速计算和AI已经被世界上几乎所有的计算和云公司所采用。”

本次发布会亮点主要有五方面:Grace Hopper支持用于运行生成式 AI 的大内存超级计算机、模块化参考架构推动实现 100 多种加速服务器配置、WPP和 NVIDIA 在 Omniverse 中创建数字广告内容引擎、网络技术加速基于以太网的 AI 云、NVIDIA ACE 游戏开发版通过生成式 AI 给游戏角色带来更好的画面体验。

生成式AI的大内存超级计算机

在会上,黄仁勋发布了能够为企业提供的DGX GH200 大内存AI超级计算机。通过 NVIDIA NVLink,这台超级计算机将多达 256 块 NVIDIA GH200 Grace Hopper 超级芯片整合到一个数据中心大小的 GPU 中。黄仁勋宣布,GH200 超级芯片目前已全面投产,它将节能的 NVIDIA Grace CPU 与高性能的 NVIDIA H100 Tensor Core GPU 整合到一个超级芯片中。

DGX GH200 提供 1 exaflop 性能与 144 TB 共享内存,比单个NVIDIA DGX A100 320GB系统高出近500倍,让开发者可构建用于生成式AI聊天机器人的大型语言模型、用于推荐系统的复杂算法,以及用于欺诈检测和数据分析的图形神经网络。谷歌云、Meta和微软是首批有望接入DGX GH200的企业。

英伟达推出全新AI超级计算机,谷歌云、Meta和微软将为首批客户

NVIDIA DGX GH200 AI超级计算机为生成式AI工作负载提供1 exaflop性能

目前,NVIDIA正在建造自己的大规模AI超级计算机NVIDIA Helios。这台超级计算机将于今年上线,它将使用四个与NVIDIA Quantum-2 InfiniBand网络相连的DGX GH200系统,可提供训练大型AI模型所需要的数据吞吐量。黄仁勋宣布,将有超过400种采用NVIDIA 最新版本Hopper,Grace,Ada Lovelace和BlueField架构的系统上市。

云网络、游戏应用等加速布局

云网络方面,黄仁勋发布了专门用于提高以太网AI云性能和效率的网络平台NVIDIA Spectrum-X。该平台将Spectrum-4以太网交换机与BlueField-3 DPU和软件相结合,相较于传统的以太网结构,AI性能和电源效率提高了1.7倍。

游戏应用方面,黄仁勋发布了NVIDIA Avatar Cloud Engine(ACE)游戏开发版。开发者可以使用这项代工服务构建和部署定制化的语音、对话和动画AI模型。该引擎将赋予非玩家角色(NPC)对话技能,使他们能够以进化出的逼真个性回答问题。NVIDIA ACE游戏开发版包含NVIDIA Riva等AI基础模型,可检测并转录玩家的语音。NVIDIA NeMo可根据文本提示生成定制化的回答并通过NVIDIA Omniverse Audio2Face实现动画化。

为了满足各种规模数据中心的需求,黄仁勋发布了一个用于创建加速服务器的模块化参考架构NVIDIA MGX。系统制造商将使用该架构快速、经济地构建100多种不同的服务器配置,满足各种AI、HPC和NVIDIA Omniverse应用的需求。 黄仁勋表示,凭借MGX,制造商可使用通用架构和模块化组件构建CPU和加速服务器。MGX支持NVIDIA全部GPU、CPU、DPU和网络适配器系列,以及各种风冷、液冷机箱的X86和Arm处理器。

此外,对于微软的合作,黄仁勋介绍了NVIDIA和微软如何在生成式AI时代一同推动Windows PC的创新。黄仁勋表示,通过使用全新的和经过强化的工具、框架和驱动程序,PC开发者可以更加轻松地开发和部署AI。例如用于优化和部署GPU加速AI模型的Microsoft Olive工具链,以及新的图形驱动程序,将大幅提升配备NVIDIA GPU的Windows PC上的DirectML性能。这项合作将加强1亿台配备RTX GPU的PC性能,并继续扩大设备数量。这些GPU中的Tensor Core可大幅提升400多个AI加速Windows应用和游戏的性能。