英伟达vGPU 7.X发布，为教育科研提供无限可能

云栖网 2019-01-31 16:05 来源：云栖网作者：黑白

【慧聪通信风】众所周知，人工智能市场是个超级巨大的市场，李开复就曾说过，人工智能的市场价值将超过整个互联网世界。而异构计算是人工智能计算的载体，对于芯片厂商而言，这一市场绝对不容有失。近几年来，对于深度学习或其他企业级的用户来说，GPU的使用在数据中心已经变成常态的配置。因此，NVIDIA也开始从vGPU的图形计算开始往纯数据中心发展，从工作站到数据中心，英伟达发布了一系列相关的解决方案。NVIDIAProviz亚太区业务主管沈威表示：高性能计算领域将越来越虚拟化，NVIDIA认为这是个趋势，并从高性能计算、图形计算开始，为传统的高性能、图形计算用户提供工作站之外的选择。

NVIDIA GPU虚拟化解决方案架构师张洁

NVIDIAGPU虚拟化解决方案架构师张洁表示：出于管理和安全的诉求，现今越来越多的企业要把这些图形设计和员工数据管理起来，一般企业会采用虚拟化的方式把传统的物理图形工作站变成虚拟化的工作站，放到数据中心中运行。在数据中心，如果每个用户给一个物理GPU卡，这无论从空间还是成本的角度都是不现实的。于是NVIDIA推出了GPU虚拟化技术，把性能非常强劲的卡虚拟成很多小的逻辑的、虚拟的vGPU，这样虚拟化可以方便地把图形用户从传统的物理工作负载方式迁移到数据中心。由于vGPU是纯软件解决方案，产品迭代速度会比硬件快一些，也更适应当前的个性化和灵活性的需求。

vGPU7.X特性：为业务提供更多可能

据张洁介绍，NVIDIA把7.0和7.1统称为7.X，vGPU7.1是刚刚发布的新版本。vGPU7.X有以下几点特性：

1、多GPU支持。7.X版本不仅可以做GPU资源切片即所谓的“一虚多”，来满足对计算力要求不高的用户场景，也可以满足对计算力要求高的用户需求，可以把多个物理GPU虚拟化后分配给某一个用户。

2、vMotion动态迁移的实现。如数据中心热迁移，7.X版本已经可以支持VMware和Citrix的服务器虚拟化平台，可以在数据中心进行业务不中断的迁移。数据中心用户可以把大量的GPU业务放到虚拟化平台上，放到GPU资源池里进行实现。

3、物理GPU特性向vGPU移植。传统物理环境中的特性都会被移植到虚拟化环境中。NVIDIA的目标是让vGPU的特性和物理GPU特性一致，来方便传统的物理GPU用户通过虚拟GPU解决方案平滑、无缝地迁移到数据中心。

如物理GPU方面，NVIDIA此前发布了整机解决方案DGX-1，DGX-1可以配合NVIDIAGPUCloud(NGC)把NVIDIA优化好的人工智能神经网络框架下载到DGX-1这种一机8卡或一机16卡的环境里训练。现在，用户可以把NGC配合NVIDIAvGPU软件来使用，把NGC上优化好的Docker镜像直接下载到vGPU环境里，进行推理和训练。

4、支持TeslaT4，这一全新基于图灵架构的GPU。有TensorCore可做人工智能加速，RTCore做实时光线追踪加速，有CUDACore做图形和计算。

NVIDIAvGPU7.X为高等教育助力

在张洁看来，vGPU到了7.0以后，可以把多个物理GPU虚拟化以后分配给某一个用户。目前可以实现两个功能，一是针对于性能要求不高的场景，比如图形场景、教学场景和开发测试场景。二是针对对算力要求非常高的用户，这时候可以使用多vGPU功能把它分配给到每一个虚机提供给这些用户。而在教育方面，NVIDIA在国内做了很多案例。

随着现在人工智能的发展，全国已经有50多家高校开设人工智能课程，有的学生需要有实训的环境。据介绍，高校用户他都是通过购买功能非常强劲的GPU进行切割，给到学生vGPU，学生上完实践课以后，可以把vGPU资源收回来给到更好的学生。比如一个高校有的时候需要低算力，有的时候需要高算力。需要低算力的场景一般是教学场景，学生需要低算力的GPU做教学实践和实训。老师做科研需要很高算力的GPU。虚拟化可以让这些合二为一，比如学生在上实训课的时候，把整个GPU资源池里的GPU进行切割，以低算力的方式提供提供给这些学之后这些GPU释放出来，可以把物理GPU给到某一个老师或某一个教授做科研相关的事情。虚拟化可以让它变得更灵活。

张洁表示，NVIDIA的vGPU解决方案会比之前更加灵活。一是通过虚拟化的手段，尽量多的满足用户不同场景的需求。二是通过虚拟化的手段，不断地增强GPU在数据中心里的特性。因为越来越多的人工智能应用在数据中心做训练，训练完以后要上线推理。比如和智能音箱进行沟通，进行语音识别时，后台会有GPU服务器进行支撑。所以，大量GPU数据中心需要被管理起来，需要具备数据中心的特性，这是传统纯物理的GPU所不具备的。我们需要用虚拟化的手段弥补它在数据中心有一些特性的缺失。这也是符合vGPU解决方案发展的趋势。

沈威同时表示，随着GPU慢慢地融入到数据中心里，2019年NVIDIA将会在几个方面发力。一是怎么样让企业，尤其是制造业、传媒娱乐等，将其vGPU的使用加速融入到其企业应用里；二是以车企作为案例，随着对GPU运算要求越来越高和GPU硬件本身的迭代，对车企而言可能标准场景多是做设计和渲染的，但车企也有很多需要做模拟、高性能计算的场景

尽管沈威说的很简短，不难发现2019年NVIDIA对vGPU的重视的信心，希望可以通过vGPU实现以往不能实现的功能。相信2019年会有越来越多的场景结合vGPU在图形计算和高性能计算从而得到大发展。