拨开深度学习部署迷雾，还看OpenVINO™推理引擎

云栖网 2021-04-16 15:28 来源：英特尔物联网

云栖网：《沉默的真相》、《隐秘的角落》，这些热门的悬疑推理大戏，都来自爱奇艺的“迷雾剧场”。然而，很多人可能不知道：“迷雾”成功的背后，离不开另一种推理——人工智能深度学习。爱奇艺的Jarvis深度学习云平台，在业务层面服务于全流程智能视频服务，包括智能创作、智能生产、智能播放等等，在技术层面，它支撑智能视频服务在业务弹性扩展、资源统一调度和主流深度学习框架支持等方面的要求。

在深度学习的具体使用过程中，爱奇艺需要应对AI基础设施层面的两个主要挑战：

01AI应用的爆发式增长，需要基础设施能够提供快速、便捷的部署能力；

02多样化的AI模型和框架，需要基础设施提供更优的支持。

拨开深度学习部署迷雾，还看OpenVINO™推理引擎

利用OpenVINO™工具套件英特尔发行版，爱奇艺大幅提升了AI应用的深度学习推理效率，不同应用的优化加速能力可达数倍至数十倍。

深度学习应用的基础设施部署是普遍存在的难题。知名云服务提供商RackspACE调查了1870名全世界各行各业的IT主管，在实施AI面对的诸多困难中，“缺少支持AI的技术基础设施”排名第二。这正是英特尔的OpenVINO™工具套件和深度学习部署工具套件的用武之地，特别是英特尔深度学习推理引擎的部署，使用独立于硬件的统一API，使得部署深度学习解决方案更加容易上手。

转换、推理、集成离不开这些最佳实践

在部署英特尔深度学习推理引擎的过程中，共分三个步骤：

■转换：

将经过训练的模型从特定框架（例如Caffe或TensorFlow）转换成独立于框架的中间表示（IR）格式。

■模型推理/执行：

经过转换后，推理引擎使用IR来执行推理。

■集成至产品：

模型推理通过示例验证后，将推理引擎代码集成到实际应用或管道中。

拨开深度学习部署迷雾，还看OpenVINO™推理引擎

其中每个步骤都有一些最佳实践，可以优化性能。要想知道优化的效果如何，有些必备的准备工作，特别是要想清楚需要收集哪些性能数据，具体包括：

1明确哪些是需要测量的操作，避免包含一次性的操作，推理引擎之外的操作也要单独跟踪。

2测量延迟与吞吐量。

3比较原生/框架代码的性能。

做到上述几点，就能获得可信的性能数据。

接下来，让我们看看完成前述三个步骤的部分相关最佳实践。

01转换

■针对目标硬件，使用对应插件完成优化；

■注意CPU的吞吐量模式；

■面向GPU和FPGA部署时，需要注意相关参数和细节，具体请参考技术文档。

拨开深度学习部署迷雾，还看OpenVINO™推理引擎

02模型推理/执行

■在异构模式下的模型推理和执行，要用加速器计算推理网络中负载最繁重的部分；

■要在不同硬件器件上运行网络分支，这样可以更高效地使用所有的可计算器件；

■FPGA的异构场景需要注意相关参数；

■异构执行的结果可通过设置参数辅助可视化分析。

拨开深度学习部署迷雾，还看OpenVINO™推理引擎

03产品集成，即将推理引擎插入应用

■针对NUMA架构处理器，需要完成特定参数设定，从而实现最佳性能；

■应使用推理引擎加速图像预处理和转换；

■如果要在推理引擎和媒体/图形API之间共享数据，一般采用基于共享系统内存的方法；

■如果应用同时执行多个推理请求，需要考虑特定性能因素，详情请参考技术文档；

■使用推理引擎异步API可提高应用的整体帧速率；

■使用英特尔VTune放大器工具，能够帮助理解分析性能数据。

革命性的AI，无处不在

2019年，德勤发布了《全球人工智能发展白皮书》，其中的调研指出：大多数采用人工智能的企业相信，AI将在未来3年内彻底改变他们的组织和行业。

拨开深度学习部署迷雾，还看OpenVINO™推理引擎

从高质量医学成像，到库存自动化货架检查，从人工智能交通控制，到多媒体动画制作，工业和制造业、医疗保健、实验室和生命科学、零售、安全和安保，OpenVINO™在所有这些行业中都在大显身手，以高吞吐量、高效率提升推理应用程序的表现。随着AI的无处不在，一些机械的、重复的工作将由AI帮我们完成，也许我们就能省下来更多时间、更多精力去看烧脑大戏，让我们的大脑在另一种形式的推理中拨开迷雾，现出暖阳。

推荐阅读