(CWW)当前国家大力推动“东数西算”和“双碳”战略,将催生以数据为关键生产要素、算力为核心生产力的绿色经济新形态。算力网络可提供基于数据、计算、智能、网络融合发展的新型共享服务模式,广泛服务于智能科学计算、行业数字化应用、政府大数据治理和公共服务等场景,成为我国数字经济发展重要驱动力。算力承载网络作为算力服务的底层支撑系统,负责完成算网中多级算力节点的接入与互联、数据的传输与备份、资源的调度与协同。算力承载网成为算力网络发展的根基,也将影响算力服务体验的品质。目前,业界已积极开展了算力承载网络架构、关键技术和演进方案的研究。本文将分析典型算力应用场景和承载需求,梳理算力应用的SLA指标。在此基础上,开展SPN(切片分组网络)算力承载关键技术研究和探讨,最后给出SPN算力承载网演进策略建议。
典型算力应用场景与承载需求分析
(资料图片仅供参考)
“算力+网络”双SLA承载需求
5G、人工智能、大数据和云AR/VR等新型ICT技术的发展,将推动我国数据中心和算力网络的建设。在国家“东数西算”政策驱动下,算力网络将迎来新一波的发展热潮。现阶段,运营商和云服务商都在规划覆盖城域边缘算力、省级核心算力、区域枢纽算力的多级算力网络。不同的算力应用对算力资源和网络连接需求存在较大差异,承载网需满足多级算力调度和“算力+网络”双SLA承载需求。典型算力应用场景和业务流量流向如图1所示。
图 1典型算力应用场景和业务流量流向
表1算力承载网“算力+网络”双SLA承载需求
算力承载网“算力+网络”双SLA承载需求如表1所示,总体来看,不同算力应用场景的算力和承载需求趋向差异化和多样化。超算和大数据类应用提出了强算力、大带宽和高可靠的承载需求,典型应用主要体现在高校/研究机构的科学计算、政府大数据治理和公共服务领域。实时采集决策类应用主要涉及基于高清图像处理和策略下发的智能计算场景,提出了确定性低时延和高可靠的网络需求。AI机器视觉类应用主要体现在智能制造的高清视频质检等场景,带来了大带宽、低时延和高可靠的承载需求。云AR/VR和视频渲染类应用主要涉及云边侧多级视频渲染的T~P级别大型算力,提出大带宽、低时延的承载需求。物联网数据采集类应用采用边缘算力完成对各类异构终端的远程状态监测、性能测量和远程控制,该应用带来小带宽和广连接的承载需求。工业控制类应用呈现出低时延、低抖动、低带宽和高可靠的确定性承载需求。DC异地灾备提出大带宽、低时延、安全隔离的确定性承载需求。
结合典型算网应用场景和需求分析,随着算力资源的不断下沉,面向行业和用户/家庭类的应用(表1和图1中②~④类)主要涉及城域边缘算力调度;超算和备份类应用(表1和图1中①、⑤类)要求更强的核心调度能力。随着算力资源从中心向边缘发展,广覆盖的城域网络也成为算力承载的关键,需发挥城域承载网络优势,以网络为核心调度算力资源,支持泛在的算力接入和互联。
算力承载网的挑战与特征
算力流量/流向复杂性、算力接入的广覆盖要求承载网具备更加灵活泛在的连接能力,面向分布在边缘、区域中心、枢纽中心的泛在算力资源,结合不同应用的东西向+南北向复杂流量流向,在骨干层灵活高速的全光连接基础上,城域/接入需采用协议精简的L1~L3层技术实现快速敏捷的算力接入和调度。
满足算力应用的差异化承载需求,业务多维感知成为基本网络能力要求。不同算力应用在承载网络性能、算力类型、算力规模上均存在明显差异,通过多维算网性能、业务和通道的深度感知,精准适配差异化的承载技术和方案,从而保障业务的高质量体验。
支撑行业关键应用,确定性网络成为高品质承载的重要保障。确定性带宽、确定性低时延/抖动、高可靠性等网络能力将有效支撑行业关键应用。如在数据存储备份场景下,需要提供跨地域大带宽的数据搬运服务,要求提供大带宽、低时延、高可靠的确定性网络服务。
灾备场景和应急通信场景对承载网络管控系统提出智能调度和弹性便捷的能力要求。数据存储灾备场景需要提供跨地域海量数据备份,承载网络需提供算力智能调度服务,支持算力、网络资源的自动化分配和智能化调度。此外,应急算力通信场景需提供弹性的网络带宽服务。算力服务供给要保证算力使用的便捷性,保障用户能够随时随地接入不同区域、不同企业提供的算力资源。
SPN算力承载网架构
随着“东数西算”战略的实施以及运营商算力网络建设的逐步推进,面向区域和地市的边缘算力将在城域范围内广泛部署。具备综合业务承载网能力的SPN将面临复杂的算力接入和互联场景,主要包括区域算力用户接入、边缘算力用户接入、边缘算力云边协同、边缘算力边边协同等场景。中国移动端到端算网连接通常包括边缘算力、中心算力、SPN网络、云专网等,典型结构如图2所示。
图2端到端算网连接典型结构
SPN主要负责在城域范围完成边缘和城域算力的接入,通过与云专网采用网络层接口互通,实现与中心枢纽算力的连接和调度。在转发层面,SPN网络与云专网可采用网关和逐跳方式构建跨域SRv6隧道。在管控层面,SPN算力承载网现阶段采用分层分域的管控架构,SPN网管、云专网控制负责各自域内SRv6隧道配置管理,上层的跨域编排器通过SRv6强大可编程能力实现多个跨域隧道的统一编排和绑定标签的配置。
SPN算力承载网关键技术
基于SRv6的灵活泛在连接技术
通过引入SRv6技术,SPN可实现全程基于标准IPv6的转发,提供覆盖“云、网、边”的端到端SLA保证能力。传统SPN设备采用SR-MPLS满足5G承载南北向和东西向流量的转发需求。在5G网络中,由于东西向流量占比相对较小(<5%),且东西向连接多发生在相邻基站间,业务流量流向的复杂度相对较低。因此,SPN网络主要采用域内SR-TP隧道、少量跨域场景引入SR-BE隧道的方式。相比5G网络,算力承载的业务流量和流向将更为复杂多样,涉及多级算力、复杂流量流向调度,原有的承载技术体制已无法满足算网承载需求。
在隧道层面,通过采用SRv6 Policy可实现SPN城域网到云专网业务的一跳入云和端到端SR-TE承载,为算力接入和互联提供灵活选路、跨网融合能力。采用S-BFD结合SRv6 Policy HSB保护,将提升隧道故障的快速检测和端到端保护能力。SPN城域网与云专网通过EBGP协议可实现跨域路由的发布,从而构建跨越云网的端到端SB-BE隧道,满足跨域灵活边缘算力接入、算力互联需求。
在业务层面,通过引入EVPN L3VPN over SRv6实现基于BGP协议的私网路由学习分发及L3 VPN业务高效承载。EVPN L3VPN支持基于VPN FRR和IP FRR/混合FRR的节点级保护技术,可提供业务层的高可靠性保证,支撑算网业务灵活泛在、高质量的承载。
基于通道的算网感知技术
SPN网络支持MTN、FGU、SR-TP/MPLS-TP和SR-BE等多种通道技术。基于不同的算网承载需求,SPN需匹备相应的技术机制,实现基于通道的算网感知能力。目前,SPN通道算网感知技术采用了首节点感知、管控系统集中下发通道配置的方式。SPN网络可提供透明感知、敏捷感知和深度感知3种算网感知通道方案,如图3所示。
图 3SPN通道算网感知技术
在业务场景方面,透明感知通道通过SPN端到端时隙交叉连接能力实现算网连接,适用于低时延、高安全隔离的场景;敏捷感知通道在SPN内采用SR-TP隧道,适用于灵活高效算网连接场景;深度感知通道采用了全程SRv6 Policy部署方式,主要面向泛在算力部署下的算网连接场景。
在技术机制方面,三类感知通道本质上都是利用了SRv6强大的可编程能力,通过SRv6的转发行为可编程功能实现将SRv6 Policy绑定至MTN/FGU通道、SR-TP隧道和逐跳SRv6。敏捷感知通道采用网关方式实现SRv6 over SR-TP,深度感知通道则是采用了逐跳SRv6实现跨域SRv6 Policy;透明感知通道通过SRv6的SRv6 SID可编程实现不同层隧道的绑定。
基于MTN接口的确定性品质承载技术
表 2SPN网络的切片资源隔离技术及时延特性
注:表中单跳时延为未拥塞下P节点数据;单跳抖动为切片间拥塞切片内不拥塞时高优先业务P节点数据。
SPN算力承载网演进策略建议
基于对SPN算力承载网关键技术和方案的研究,本文探讨性地提出了SPN算力承载网演进策略建议。目前,业界已基本达成共识,算力网络的发展将经历算网协同、算网融合和算网一体3个阶段。随着算力网络的发展演进,SPN算力承载网也将按照3个阶段不断创新发展,SPN算力承载网演进如图4所示。
图 4SPN算力承载网演进
在算网协同阶段,“网”与“算”相对独立,通过上层算网编排器实现算力和网络协同调度和运营。此阶段,SPN算力承载网实现从SR-MPLS向SRv6逐步演进,具备SRv6基本能力,包括SRv6 Policy、EVPN L3VPN、EBGP等,支持基于网关和逐跳的通道算网感知能力。管控层面通过运营编排系统实现业务的敏捷发放。
在算网融合阶段,“网”与“算”的基础设施完成部分融合,同时形成统一的“算网大脑”,实现算网融合的服务供给和一体化运营。此阶段,SPN算力承载网将向“IPv6+”持续演进,具备“IPv6+”的增强功能,包括应用感知(APN6)和业务链(SFC)等,实现基于应用驱动的网络感知算力;支持基于SRv6的算力时延可视、可测和选路。管控层面通过向算力平台开放网络能力,提供算网融合服务。
在算网一体阶段,彻底打破算网边界,形成算网一体化的基础设施,让用户可以随时随地体验到多要素融合和算网一体化的服务。此阶段,SPN算力承载网将基于统一算网标识和度量,实现算力感知和算力路由。在管控层面,网络路径计算将融合算力资源信息,实现最优资源调度。
随着算力网络的发展演进,算力承载网需经历技术和标准的不断创新。产业界需凝聚共识,协同推动算力承载技术的应用落地和标准化工作,共促算力网络的持续发展。
*本文首发于《通信世界》
2022年11月10日 第21期 总第907期
原文标题:面向算力承载的SPN关键技术与演进策略探讨