资讯 频道

全球球顶会SIGCOMM录用智能无损独创技术论文

  近日,华为超融合数据中心网络智能无损技术论文《ACC: Automatic ECN Tuning for High-Speed Datacenter Networks》入选ACM SIGCOMM 2021,表明超融合数据中心网络的智能无损技术得到业内专家的一致认可,具有世界级技术影响力。

  扫描阅读二维码:https://dl.acm.org/doi/10.1145/3452296.3472927

  SIGCOMM是美国计算机协会在通信网络领域的旗舰型会议,也是目前国际通信网络领域的顶尖会议。SIGCOMM对论文的质量和数量要求极高,质量方面要求具有基础性贡献、领导性影响和坚实系统背景。SIGCOMM录用的论文大多数会被广泛引用,具有非常大的影响力。

  全无损以太核心算法:华为独创ACC技术

  本次入选的华为ACC(Automatic ECN)技术是华为全无损以太网络智能无损技术的代表。当今,随着AI和云业务发展,数据中心承载着诸多需要高带宽和低延迟的应用,包括大数据处理、分布式存储和高性能计算。而在已经广泛部署的拥塞控制方案中,显示拥塞通知(ECN: Explicit Congestion Notification)在保障网络和业务高带宽低时延中起到关键作用。但是传统的静态ECN参数配置,无法自适应数字时代种类繁多的动态业务流量模型。例如,在不同厂商交换机、网卡等组成大型异构数据中心网络中,协同联调静态ECN参数变得非常困难;尤其在云多租户网络中,存在不同时空流量模型,导致网络工作负载动态变化,需要不同时间点适配ECN参数,事先配置的ECN参数则无法满足动态业务流量的性能需求。因此,在大规模高速组网和多租户业务流量等复杂场景下,人工调整全网适配ECN参数成为巨大挑战。

  基于此,华为联合南京大学设计和实现ACC。ACC通过在超高速数据中心交换机中首次成功应用深度强化学习(DRL:Deep Reinforcement Learning)技术,自适应流量模型来动态调整ECN参数,从而简化网络运营,实现网络高利用率和低延迟。同时, ACC设计分布式多智能体技术实现大规模组网下可扩展性、基于商用交换芯片Telemetry能力实现快速可部署性、结合在线和离线训练方式提高场景的可泛化性,从而最终达到大规模高速网络的高吞吐和低时延性能目标,并且从业务层面保障应用性能表现最优。

  华为超融合数据中心网络CloudFabric 3.0,新以太释放新算力

  在ACC理论研究基础上,华为推出了超融合数据中心网络CloudFabric 3.0解决方案,保障网络高吞吐低时延,100%释放算力。

  华为超融合数据中心网络CloudFabric 3.0方案基于全以太架构构建0丢包的计算和存储网络,助力算力100%释放。该方案打破通用计算、存储、高性能计算三套网络架构的限制,统一使用以太网架构实现流量承载融合。该方案在业界率先实现L3自动驾驶网络能力、全生命周期自动化与全网智能运维,OPEX降低30%,使能企业智能化升级。

  华为数据中心网络已经在全球包括金融、政府、互联网、制造、能源等各大行业客户的数据中心部署。华为将持续投入智能无损技术研究,持续提升网络能力,充分释放算力,使能企业智能化升级。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
0
相关文章