践行AI战略:华为引领数据中心进入AI时代
云栖网:随着人工智能(AI)技术的快速进步,越来越多的行业都在尝试向自身的业务和系统中引入AI。在刚刚过去的2018年,华为轮值董事长徐直军曾表示,华为已经将AI定位为新的通用技术,今后会将AI技术全面引入到智能终端、云和网络等各个领域。说到做到,2019年1月9日,华为发布了业界首款面向AI时代的数据中心交换机CloudEngine16800。
华为交换机与企业网关产品线总裁钟开生告诉记者,CloudEngine16800可以支持高密400G接口,是华为AI发展战略以及全栈全场景AI解决方案的一个重要组成部分,未来将重新定义数据中心网络的代际切换。“这款交换机将为数据中心客户赋能,加速AI商用进程,引领数据中心全面迈入AI时代。”钟开生说。
从云时代到AI时代
CloudEngine是华为面向云时代的高性能交换机产品系列。2012年,华为推出的CloudEngine12800曾是当年业界首个高密100GE、正交架构的创新产品,发布之后得到了市场的高度认可。从2016年开始,华为数据中心交换机连续三年蝉联中国第一,2018年市场份额进一步达到39%,并在金融行业市场上成为第一名。金融行业是对交换机要求最高的行业之一,华为能在这个领域取得头名,足以证明产品的实力。
钟开生表示,在过去六年间,CloudEngine12800很好地满足了全球数据中心对业务弹性伸缩、自动化部署等核心诉求,先后在全球6400多个数据中心投入商用部署,销售年复合增长率达到82%,连续六年增速全球第一。“我们虽然起步晚一点,但是过去六年的增长却是最快的。”钟开生自豪的说。
在华为看来,要想获得全球市场的肯定,就必须提供世界一流的产品。为此华为长期坚持技术创新,每年将收入的10%以上用于研发投入,以此来提升产品竞争力。2017年,华为研发支出高达897亿元,占全年销售收入的14.9%。持续的研发投入让华为得到了市场的认可,在企业业务领域,全球财富500强中有211家企业将华为选作数字化转型的合作伙伴;在运营商业务领域,全球Top50的运营商中有45家都与华为建立了合作关系。
不过随着连接、数据的快速增长,传统的数据处理模式会逐渐显得不合时宜。华为在GIV2025白皮书中曾预测,2025年新增的数据量(180ZB)将远超人类处理能力,其中95%的数据将依赖AI处理。于是在数据逐渐成为所有人和企业的重要资产的时代,基于数据和AI进行决策,将成为企业经营的核心思路之一。此外,预计2025年全球企业对AI的采用率将达86%,企业数据的利用率也将从10%增至80%。绝大部分企业会采用智能云服务和智能边缘设备来实现“+智能”革命,提高数据利用率,驱动企业的流程再造和价值升级。
既然企业需要AI助力决策、重塑商业模式与生态系统、重建客户体验,那么数据中心从云时代向AI时代演进就成为必然。钟开生认为,这个演进时间不会太长,可能五六年时间就会成为现实。在此期间,必然会有越来越多的企业积极尝试AI应用,借助AI来获得新的能力、提升管理效率、客户体验以及生产率等。
将瓶颈化为通途
在过去十几年间,企业数据中心网络走过了虚拟化时代、云时代,如今正处于AI时代的门槛前。据Tractica预测,2025年全球AI业务收入预计达到598亿美元,同比2016年增长高达40倍,未来市场需求和前景都极为广阔。
在虚拟化时代,数据中心通过虚拟化技术实现了资源池化共享,提升了资源利用率,比如将服务器的利用率由20%提升到60%。在云时代,数据中心通过SDN实现了云化服务,优化了发放效率,大大压缩了业务部署时间,并带来了业务智能运维能力。那么AI时代,数据中心又该做哪些改变?
钟开生表示,当企业不断投资AI应用时,会发现数据中心网络性能对AI算力影响很大,而且可能会成为AI商用进程的一个关键瓶颈。传统以太网存在千分之一的丢包率,这会导致数据中心的AI算力只能发挥50%。另一方面,预计全球年新增数据量将从2018年的10ZB猛增到2025年的180ZB,现有100GE为主的数据中心网络本根无法应对如此规模的数据量。此外,随着数据中心不断增加服务器,加上计算网络、存储网络和数据网络三网融合,传统人工运维已难以为继,亟需引入创新的技术来提升智能化运维能力。
面对AI大面积商用带来的挑战,钟开生认为,数据中心交换机必须扩展自身的能力,满足三大特征:内嵌AI芯片、单槽48x400GE,以及向自动驾驶网络演进的能力。华为CloudEngine16800全面具备这三大特征,它是业界首款内嵌AI芯片的数据中心交换机,能够100%发挥AI算力;具有业界最高密度单槽位48x400GE,可以满足AI时代5倍流量增长需求;使能自动驾驶网络,可以秒级识别故障、分钟级故障自动定位。
三大特征为数据中心赋能
对于数据中心而言,CloudEngine16800所具有的三大特征可以全面提升能力表现。
首先,内嵌AI芯片的CloudEngine16800,承载了华为独创的iLossless智能无损交换算法,可以实现流量模型自适应自优化,在零丢包基础上获得更低时延和更高吞吐的网络性能。克服传统以太网丢包导致的算力损失,将AI数据算力从50%提升到100%,同时将数据存储的每秒输入输出性能提升30%。
其次,CloudEngine16800全面升级了硬件交换平台,具有业界最高密度单槽位48x400GE,单机提供业界最大的768端口400GE交换容量,交换能力高达业界平均的5倍,能够很好地满足AI时代流量倍增需求。
第三,CloudEngine16800基于内置的AI芯片,可以有效提升“网络边缘”的智能化水平。交换机具备本地推理和实时快速决策的能力,结合集中的FabricInsight网络分析器,可实现秒级故障识别和分钟级故障自动定位;同时,基于分布式的AI运维架构,还可以大幅提升运维系统的灵活性和可部署性。
此外,随着AI时代的到来,数据中心的数据处理量将不断攀升,随之而来的是电力消耗的增长。据统计,目前用电成本约占数据中心整体运行成本的60%以上,而网络设备的用电量占到5%左右。CloudEngine16800则可以将平均每bit数据的功耗降低50%,1台设备每年可以节省32万度电,减少碳排放259余吨,帮助客户大幅降低成本。
钟开生表示,AI数据中心交换机将帮助行业客户进一步加强智能化转型。接下来华为准备将AI技术注入到所有网络产品和解决方案中,打造一个“自动驾驶”的网络。“这样不仅可以提升网络的利用率和运维效率,还可以帮助客户加速AI业务的运行,为AI应用持续创新提供土壤。”钟开生说。