(CWW)近年来,国内外企业、标准组织、产业联盟都在积极研究确定性网络技术。确定性网络是近年来业界关注的热点之一,其根源在于信息网络技术的应用重心从to C转向to B,特别是以产业互联网为代表的新兴业务和应用的兴起,要求网络连接具有性能(如时延、抖动)和服务质量的确定性。现有的以互联网为基础的公众网络只能提供“尽力而为”的质量保障,在确定性方面有天然的欠缺;而传统的专线或专网虽然具有一定的确定性保障能力,但是综合成本较高,并不具备大规模、高性价比应用推广的条件。

因此,如何让确定性网络技术从理论研究和实验室验证走向商用,特别是具备运营商规模推广应用的基础,将是业界下一步重点攻关的方向。本文从运营商的视角,以让相关的技术和服务能够让用户用得上、用得起、用得好为宗旨,加以分析和探讨。


【资料图】

业务对网络提出确定性需求,促使连接服务发生新变革

在信息网络特别是互联网兴起的初期,以网页浏览、E-mail、VoIP和简单视频等为主要应用类型,主要面向人的通信需求,网络以简单的统计复用和路由转发为核心,提供“尽力而为”的普遍服务。然而,随着应用的丰富,特别是高质量视频、AR/VR和类专线业务的需求越来越多,网络需要在普遍服务基础上,提供差异化服务等级能力。此时,基于粗颗粒度的带宽保障、DiffServ分级机制、RSVP-TE流量工程等手段,将网络带向了确定性的世界。

伴随着社会数字化转型的加速,以面向物的通信为主的产业互联网逐步成为网络连接的需求主体,不论是远程医疗、自动驾驶还是工业制造,都需要让网络变得更加“及时”和“准确”,也就是实现确定性网络。换句话说,网络连接的使命已经从注重连通性,迈向提供可控有界的质量保障。

从历史发展进程来看,网络和应用一直是相互牵引驱动的,网络能力和服务形成确定性,既是业务和应用升级换代的基础,也是网络连接迭代演进的动力。从运营商的视角来看,传统以提供管道为主的网络连接,将进一步注入新的内涵,通过为用户和应用带来新价值,形成连接即服务(CaaS),在此基础上实现自身的增值发展。

从业界遇到的代表性业务需求来看,确定性网络近期的重点是提供时延可控的能力,典型的例子有以下5种。

自动驾驶的核心要求是保证低时延,以确保驾驶的安全性。不论是采用激光雷达还是毫米波雷达,都需要对车辆的周边环境进行实时感知判断,按照目前业界技术发展的水平,须每隔200微秒就发送一条探测指令,因此若抖动大于200微秒,就容易造成重大事故。

远程医疗的核心要求是医生在远端独立完成手术。一般情况下,医生需要通过网络传输操作的指令到手术台,同时需要接收网络传回的画面信息及体征数据,此时端到端时延要求小于50毫秒、抖动要求小于200微秒。

智能电网需要以准时的网络传递电网控制信号。在电网的继电保护中,两端保护设备向对端发送等量电流,并依据本地电压与对端接收到的电流来判断是否发生故障。为保证继电保护的准确性,单向时间差别需要小于200微秒,抖动需小于50微秒。

在线游戏的核心在于用户体验的保障。为保证游戏的公平性,参与游戏的分布式玩家需要得到服务器的同步响应。因此端到端的网络时延越低、抖动越小,玩家的游戏体验越好。

AI监控的核心是要保证多个摄像头的时延同步。AI监控的应用方式正从事后追踪变为实时预警,因此需要将不同摄像头拍摄的画面传回服务器进行AI分析,为确保不同摄像头之间传回的画面能够逐帧对齐,要求相应的时延抖动越低越好。

确定性网络结合固网和移动网不同特点加以区别对待

从提供服务的角度而言,确定性网络应该是一种端到端的服务能力,也就是说不论服务的对象是通过固网还是移动网接入,都应该提供全程的确定性保障。但是从现有网络的特质来看,目前在固网和移动网上引入确定性,其侧重点各有不同。其中,固网因网络带宽资源相对富裕、传统上实现QoS保障的技术手段较多,在确定性方面的侧重点应突出对L1~L3的协议的优化,方便在报文处理和调度上针对网络性能提供可控保障;而移动网因为传统上空口资源受限、QoS机制比较单一,应更多考虑如何设计合理化的SLA指标,从不同业务的共性特征上提供差异化的可控保障。

固网引入确定性的关注点

从广义上来看,固网的确定性就是要在一定范围内针对特定业务,部署提供确定性能力保证的Ethernet/IP网络技术。其主要考虑的是时延、抖动和丢包率指标,但是需要特别指出的是,从综合性价比的角度来看,追求苛刻时延不应成为确定性网络应用的首要目标。事实上,在很多应用场景中,用户要求的是时延或抖动指标的有界性,并非一味追求最低值,用户的应用系统完全有能力根据网络提供的确定性指标(范围)加以调整和适配,其不能接受的是性能指标的无序和无界变动。

而从技术实施上看,在L1层业界共识是通过TDM的时隙化来实现确定性网络,在L2层是以IEEE定义的TSN(Time Senstive Networking,时间敏感网络)为主来实现,在L3层则是以IETF定义的DetNet(Deterministic Networking,确定性网络)为主来实现。不论是TSN还是DetNet,其本质都是在分组统计复用的“尽力而为”转发模式基础上,通过引入时隙转发原理,提供确定性转发。

正如上述分析指出,时延和抖动是目前确定性网络主要攻关的对象,如何有效对其进行控制和调度,成为了固网特别是IP网络需要解决的核心问题。传统的IP转发机制即使配合了资源预留及优先级调度,也无法实现确定性时延,主要原因是对每个数据分组的行为缺乏控制,导致了排队形成了微突发,从而引起“长尾效应”。

当前固网的网络时延主要由链路时延和节点内时延两大部分组成,其中前者还可以细分为发送时延和传播时延,后者可细分化处理时延和排队时延。在一个稳定的网络拓扑中,链路距离及链路速率相对稳定,因此链路时延几乎没有什么变化的空间。而在不同负载的情况下,节点内部时延的变动很大,目前“长尾效应”主要就是由节点内时延引起的。从“尽力而为”的IP转发,到路径可控的MPLS TE、SRv6转发,IP广域网一直靠大带宽概率性地达成时延目标,在高负载和流量突发时依然无法提供确定性时延保障。因此需要通过新的确定性技术,消除因排队带来的转发抖动,从“大概率保证服务质量”变为“确定性保证服务质量”,从而带来数据转发面的实质进步。

总体来看,应从3个方面的协同来实现固网的确定性:一是带宽确定性,一般以用户能够达到的峰值带宽为衡量指标,通过入口带宽限速、网络优先级服务等策略,通过带宽的预留提供概率性保证;二是路径/时延确定性,以高效的方式指定路径,为用户提供不同类型的路径选择;三是抖动确定性,采用周期性调度、预留资源等新的机制,确保所有报文的传送时延被严格限制在一定范围内。

其中,在带宽确定性方面,目前常用的手段是借助FlexE(灵活以太网)切片实现端到端带宽保障。FlexE是通过在MAC与PHY层之间引入FlexE Shim层,实现传统以太技术增强,目前能够以5G颗粒度将100G以上链路切片分为多路物理带宽,从而实现端到端、物理隔离和灵活带宽能力。

在路径/时延确定性方面,业界比较看好基于SRv6(Segment Routing IPv6,基于IPv6的段路由)提供转发低时延路径及高可靠的故障保护。SRv6是基于源路由的下一代转发技术,采用TI-FLA(与拓扑无关的无环路备份路径)提供链路及节点保护,在故障时,现流量快速切换到备份路径转发,而且将中断时间降到了毫秒级。

在抖动确定性方面,重点关注基于DIP(Deterministic IP,确定性IP)等技术实现端到端时延抖动可控。DIP的原理是基于传统IP引入周期转发机制,通过控制每个数据包在逐跳的转发时间来减少微突发,消除“长尾效应”,最终实现端到端有界时延的确定性。DIP边缘整形能力可以在网络边缘的PE设备上,将到达时间不规律的报文整形到按时间划分的不同周期中;DIP周期映射能力能实现报文在网络中的P或出口PE设备上逐跳转发的时延控制,不用查看报文所属的流,从而简化了P节点的实现,同时避免了三层各种隧道封装时P节点无法识别流的问题。此外,结合SRv6路径规划,通过转发路径规划控制和逐跳转发资源预留,能进一步保证确定的时延。但是,客观来看,DIP技术在标准化方面还处于初期,业界支持力度比较有限,仍需要不断完善。

移动网引入确定性的关注点

相对于固网来说,移动网过去一直作为广域网的接入段而存在,其以解决to C的广覆盖和普遍性接入为主,缺乏面向应用的个性化需求适应能力,虽然5G的uRLLC提出了相关的要求,但是具体实现上并不理想。从以5G为代表的移动网支持确定性出发,我们认为首先应面向不同行业的典型应用,从信息网络业务的个性化需求入手,提炼出共性的确定性需求,从而设计对应的SLA和技术保障。

结合前期对用户需求的分析和梳理,我们发现移动网主要的确定性需求可以归纳为带宽(重点是上行带宽)、时延、可靠性、可用性、定位(移动网场景下位置的确定尤为关键)和安全隔离等几个维度。因此,应尽快对移动网的上述维度指标进行明确定义,从而形成不同等级的SLA,重点面向to B应用提供差异化保障服务。从技术实现上看,对于上述关键维度有不同的选择方案。

在上行大带宽方面,主要关注单UE在最优信道条件下的性能上限,包括在特定频率上的单载波、载波聚合(R15)和超级上行(R16),其中在单载波方面可考虑以帧结构的变化实现带宽的提升,当然考虑到今后频率发展,毫米波也应该纳入关注的要点中。

在空口低时延方面,主要可以通过增加子载波间隔、引入非时隙调度、上行免调度、信道抢占等手段来实现。需要特别指出的是,信道抢占技术是在uRLLC与eMBB物理资源复用的情况下,让uRLLC通过抢占eMBB信道实现优先发送,会对eMBB用户体验带来巨大影响,非特殊情况一般不建议采用。

在可靠性增强方面,主要可以通过在空口对时、频、空资源的分层次冗余实现,具体的手段有PDCCH CCE聚合增强、专用低码率MCS表、PUSCH/PDSCH重复传输、PDCP复制和Multi-TRP等。

在可用性增强方面,主要可以通过基站、承载网和核心网的硬件设备的备份冗余,以及终端的双链路接入等相互结合来实现。

在定位能力方面,对10米级的定位主要借助北斗等GNSS系统进行,对米级和分米级的定位主要借助基站5G信号传播到达时间差和方位差实现,对厘米级的定位则需要借助多方平台和技术增强(如在室外通过北斗+差分来实现)。

在安全隔离方面,主要可以通过对无线网部分和核心网部分采用物理隔离和逻辑隔离实现,物理隔离主要采用专用的网元设备(如基站、C-IWF、UPF、5GC等),逻辑隔离主要采用网络切片、VPN等实现。

下一步应面向商用加快创新突破

总体而言,确定性网络技术已经在原理上取得了长足的进步,并在实验室和现网开展了一定的仿真试验和试点,验证了技术上的可行性。但是,确定性网络距离规模商用还有较长的路要走,特别是从提升技术方案的便捷性和性价比角度,仍需重点解决以下几个问题。

技术的完善性

现有的多种技术,在解决局部问题上有所突破,但是要在运营商网络规模使用,特别是跨广域网部署,仍然需要有全局的端到端的突破。举例而言,TSN技术需要逐流维护状态,但在大规模网络的汇聚节点存在因为性能方面的原因无法实现逐流控制的问题,因此目前还不适用大规模网络;DetNet技术只实现了L3层的可靠性保障,尚未实现转发时延控制,其时延保障仍需要L2层引入TSN,增加了部署难度;而DIP技术虽然对TSN机制加以了改进,但仍然没法解决转发设备的时间同步、大规模逐流调度等难题。

技术的标准化

虽然多个标准组织对确定性网络技术开展了工作,并形成了多个标准,但是仍缺乏总体性、系统化的共识标准体系,特别是在不同标准衔接时还存在空缺。以5G的TSN为例,目前3GPP没有定义承载网的确定性转发机制,不利于端到端网络保障;也没有定义TSN AF和CNC之间的接口,不便于异厂商的互联互通。

技术的易用性

总的来说,确定性网络的引入一定是在现有网络技术和协议上进行改动,即做“加法”引入新的机制,但是过多的“加法”必然增加设备的复杂度,特别是很多实现机制需要与硬件进行耦合,一方面增加了规模部署的成本,另一方面也带来了迭代升级的难度。因此,需要适当考虑在现有技术方式上做“减法”,尤其是在协议改造的复杂度和实现效果间实现平衡,以综合性价比为第一追求目标。

可喜的是,目前业界已充分认识到了这些问题,产业链上下游都在为实现确定性网络的规模商用而努力,其中包括国内外的标准组织、运营商和设备厂商,他们正在携手开展协议的优化定制、技术的标准化等工作,相信在未来的几年内,确定性网络有望实现运营商规模应用。

*本文首发于《通信世界》

2022年11月10日 第21期 总第907期

原文标题:确定性网络技术迈向运营商级的思考和建议

推荐内容