英伟达：视觉盛宴无处不在，让AI流行起来

云栖网 2019-07-29 10:46 来源：云栖网作者：黑白

云栖网：7月17日-19日，InfoCommChina2019在北京拉开帷幕。作为专业视听集成设备与技术的国际性展会，北京infocommChina每年吸引超过350家海内外知名企业、数万名专业人士和观众参与。

作为第五次参加展会的英伟达，本届展会带来了专业视听领域的多款解决方案，覆盖数据中心、边缘计算以及云图形应用等，集中展示AI赋能下专业视觉领域新突破，以及NVIDIA最新专业视觉解决方案在提升工作效率，推进专业视听产业升级中不可或缺的作用。

就像NVIDIA中国区高级市场总监刘念宁介绍的一样：“英伟达致力于将人工智能和计算机图形技术的结合，让RTXForEverywhere(RTX无处不在)。在人工智能方面，英伟达不仅有硬件产品，而且做得重要的是软件，包括CUDA-X。RTXForEverywhere和CUDA-X软件包，可以帮助很多创造者。”

英伟达：视觉盛宴无处不在，让AI流行起来

RTX服务器：实时光线追踪，为游戏与影视制作提速

要了解RTX服务器，不得不提RTX技术。光线追踪技术（RTX）由来已久，但因为其所需计算量非常大，直到这两年，NVIDIA才提出实时光线追踪。英伟达高级解决方案架构师宋毅明解释，“RTX的RT就是RayTracing(光线追踪)X是什么呢？大家看X战警，它表示强大神秘的力量，我们这里就是实时光线追踪，X可以理解是一个强大的技术。”

过去渲染等图像编辑任务耗时长、工种流程多、单一化管理效率低下。而在现在这个时代，内容成爆炸式增长，无论是好莱坞大片、汽车建模、建筑设计，还是游戏和个人娱乐，都需要强大计算力的支撑，与此同时，人们对高品质渲染愈发挑剔。

2018年，英伟达提出Turing架构，该架构加入RTCore，可以实现对象和环境的实时光线追踪，并做到物理上精确的阴影、反射和折射以及全局光照。因为它加入了TensorCore，能加速深度神经网络训练和推理，这对赋力AI增强型产品和服务至关重要。此外，它还支持8K编解码芯片，可以直接利用硬件，再结合CUDA-X解决方案，让用户能直接在显存中处理视频。

值得一提的是，在计算机图形领域，Quadro是NVIDIA的一大核心产品。NVIDIAQuadroRTXGPU依托NVIDIATuring架构和NVIDIARTX平台，带来硬件加速的光线追踪、人工智能、高级着色及仿真，为设计师和艺术家带来实时的逼真场景渲染，为其工作流程增添AI能力，使其能够与复杂的模型和场景进行流畅的互动，从而彻底变革以往的工作流程。

尽管QuadroRTXGPU可用于个人PC中，当一个渲染团队往往有几十或上百人，工作流程非常复杂，一个员工设计或创造一个资源，团队其他成员可能都要等他完成这项工作。于是，NVIDIA推出RTX服务器。

RTX服务器共有8颗GPU，有QuadroRTX6000和RTX8000两种GPU可供选择，每两个通过NVLink连接，可以处理数据量非常大的工作流程。两种GPU的CUDACore和RTCore数量均相同，只有显存大小不同。

英伟达：视觉盛宴无处不在，让AI流行起来

据介绍，通过原来单颗GPU或者CPU农场的渲染方式，可能一天只能设计两个镜头。而通过RTX服务器强大的计算力，一天可以完成大概7个镜头。

用户可将任务通过后台方式提交给RTX服务器，渲染以后以流的方式推出，直接就能看到RTX服务器渲染出来的场景。用户可将资源丢给后台服务器渲染，继续做下一个工作。《汽车总动员》即是通过RTX服务器进行渲染的。

NVIDIA在现场展示了基于RTXGPU的图像编辑过程，用户只需点选设置全局光照、阴影、环境光遮、反射等效果，机器就能自行完成实时的光线追踪，整个过程流畅自然，而且渲染效果非常细腻。

在2019年的第91届奥斯卡金像奖颁奖典礼上，有五部影片获得最佳视觉效果提名，《复仇者联盟3：无限战争》、《克里斯托弗·罗宾》、《登月第一人》、《头号玩家》、《游侠索罗：星球大战外传》。这五部电影的背后，都有英伟达强大的GPU技术在支撑。

英伟达：视觉盛宴无处不在，让AI流行起来

同时，通过在网络边缘对RTX服务器进行低延迟访问，云渲染AR和VR应用成为现实。

随着具有高带宽和超短延迟等特点的5G网络的出现，渲染、流式传输，甚至复杂的应用程序在云端都变得可行。借助5G边缘网络上的RTX服务器，用户几乎可以在任何设备上访问GeForceNOW、AR和VR应用等云游戏服务。

宋毅明表示：“网络枢纽和游戏服务器之间的物理距离会增加延迟时间，通过减少这一距离，并将边缘计算应用于云游戏，可为固定宽带网络和移动宽带网络带来诸多好处。”

如今，NVIDIARTX服务器包括全面优化的软件堆栈，可用于OptixRTX渲染、游戏、VR和AR、以及专业可视化应用程序。无论是在桌面上进行内容创建还是在数据中心进行批量和最终帧渲染，NVIDIARTX服务器的用户都能够利用GPU加速渲染和性能，所需的成本、占地空间和功耗远低于CPU渲染农场。NVIDIARTX服务器为艺术家提供他们需要的处理能力，助力其探索更多创意可能，使他们无需经历长时间的尝试就能创建更高品质的视觉效果。

数据科学工作站，更快速更准备

数据科学是计算机科学发展快速的领域之一，它影响着每个行业的发展。企业都迫切希望能够利用机器学习释放其业务数据的价值，并地大量聘用数据科学家，而这些数据科学家正需要专门针对其需求设计的强大工作站。于是，NVIDIA推出了出强大的全新工作站，旨在助力数百万数据科学家、分析师和工程师更快速、准确地做出业务预测并提高生产力。

英伟达：视觉盛宴无处不在，让AI流行起来

NVIDIA赋力的数据科学工作站基于强大的参考架构搭建，该架构由两颗高端NVIDIAQuadroRTX™GPU和NVIDIACUDA-XAI™加速数据科学软件构成，如RAPIDS™、TensorFlow、PyTorch和Caffe。CUDA-XAI是一个资源库合集，让现代化计算应用能够从NVIDIA的GPU加速计算平台中受益。

数据科学问题涉及海量数据，需要极高的处理能力。NVIDIA赋力的数据科学工作站使科学家能够轻松、快速且准确地进行模型的准备、训练和部署。其特性和优势包括：

•两颗高端QuadroRTXGPU—基于最新NVIDIATuring™GPU架构，专为企业级部署而设计。借助NVIDIANVLink®互联技术，双QuadroRTX™8000和6000GPU可实现高达260teraflops的计算性能和96GB的内存。QuadroRTX赋力的数据科学工作站所提供的容量和带宽能够处理大规模的数据集和计算密集型工作负载，且其图形功能能够满足包括VR在内的大规模数据集的三维可视化需求。

•数据科学软件堆栈是基于Linux操作系统和Docker容器构建。其中，NVIDIACUDA-XAI是一组NVIDIAGPU加速库合集，用于加速深度学习、机器学习和数据分析。CUDA-XAI包括用于加速深度学习原语的cuDNN、用于加速机器学习算法的cuML、用于优化训练模型以进行推理的TensorRT™、以及其他15个以上的库。它们能够与NVIDIATensorCoreGPU无缝协作，加速端到端工作流程，以开发和部署基于AI的应用。CUDA-XAI可被集成到TensorFlow、PyTorch和MXNet等深度学习框架中，以及AWS、MicrosoftAzure和GoogleCloud等云平台中。

而NVIDIARAPIDS同昌一组GPU加速库分析平台，用于数据准备、传统机器学习和图形分析。利用RAPIDS将更多的数据处理管线交予GPU，可缩短模型开发时间，从而更快速地完成部署并获得业务洞察。

同时，NVIDIA联手Anaconda公司推出AnacondaDistribution，这是一种帮助数据科学家实施Python/R、数据科学、AI和机器学习的新方法。

•企业级支持—与工作站制造商一同进行测试和优化，以满足任务关键型企业级部署的需求。

•可选的软件支持-NVIDIA开发的软件和容器（包括深度学习和机器学习框架）让用户倍感轻松。

NVIDIA赋力的数据科学工作站让数据科学家能够自由地在本地开展工作，可谓是对NVIDIA的数据科学产品组合的理想补充。

据了解，该系统专为数据分析、机器学习和深度学习而设计，提供了极强的计算性能和工具，可应对金融、保险、零售及专业服务等领域中的海量数据准备、处理和分析需求。

虚拟GPU让用户随时随地挥洒创意

今天，我们在谈到技术的时候，有一个绕不过去的名词叫虚拟化，那为什么要使用虚拟化技术？简单点讲，过去办公场景主要使用笔记本，数据、操作系统均在个人端点，而一旦笔记本丢失就意味着失去一切。根据这一痛点，英伟达从管理和数据安全的角度，提出VDI和虚拟化概念，将办公数据程序和应用运行在数据中心，将高性能的物理服务器和用户的工作负载，以虚拟机的形式运行在数据中心的程序上。

NVIDIAGPU虚拟化高级解决方案架构师马林表示，虚拟化技术的应用是用户在使用计算机方式上的大势所趋。根据不同行业及用途，NVIDIA推出了不同的虚拟GPU产品。NVIDIA虚拟GPU解决方案通过加速工作流程、让用户能够随时随地开展工作，助力设计师和工程师将其创作转变为现实。此外，虚拟GPU解决方案还可以为数字化办公场所中的现代化应用程序和操作系统（如Windows10）提供经济高效的性能和易管理性。

vGPU是一款针对虚拟场景而设立的纯软件产品，最新的RTXGPU和vGPU8.0，为影视娱乐、制造业、建筑业等很多行业更好地提供RTX技术。通过vGPU，用户可以动态改变GPU的用途，只将一部分GPU的算力独立分配出来执行特定任务。“就像自助蛋糕一样，用户可以根据需求拿不同口味、不同分量的蛋糕。”

这样的方式既解决了数据安全问题，又实现统一的软件部署、统一的企业内部应用和安全策略的下发。买一台服务器即可支持很多用户，提高工作效率和投资回报，同时降低了用户的采购和运维成本。

以汽车制造业的使用场景为例，白天用户们集中办公，晚上少数用户还在加班，但服务器工作不像白天那样饱和，借助GPU的vMotion能力，可以将零散员工的工作从分散的服务器上集中在少量服务器上，将其余空闲服务器关机，以此降低能耗、节省电费，且整个过程用户无感知。

另外，用户可以结合虚拟化的场景，利用RTX服务器，让用户可以在任意设备、任意地点，通过网络访问RTX的工作平台。

vGPU产品已经进行了多次迭代，差异点主要在于对硬件架构的支持、对生态的完善。vGPU管理功能的不断增强；每一代vGPU都伴随着硬件架构的不断升级而更新。比如，vGPU7.0开始支持Turing架构；vGPU8.0新增对Quadro系列RTX6000和RTX8000GPU的虚拟化，支持热迁移，可以将显存按整数分割的方式支持更多用户，并支持Windows10的RS5版本。

凭借强大的计算力和对市场的感知力，英伟达通过将GPU作为可以感知和理解世界的计算机、机器人乃至自动驾驶汽车的大脑，GPU深度学习再度点燃了全新的计算时代——现代人工智能并广泛应用于各行各业，更是快速进入中国市场，比如RTX服务器已经与中国影视行业展开深入合作，RTX服务器和vGPU在中国的高等教育领域有着良好的应用，对于国内的内容创造者来说，如何用更好的设备创造出更有创意和想象力的事情提供了无限可能。