基于GMPLS的光网络生存性
发布时间:2006-10-14 4:10:49   收集提供:gaoqian
司 昕 施社平 罗忠生深圳中兴通讯股份有限公司技术中心研究部
  摘要 通用MPLS(GMPLS)是MPLS向光网络扩展的必然产物,它提供了网络拓扑和资源发现以及连接配制等基本的功能。本文提出了基于GMPLS的网络故障恢复机制,包括其实现过程以及相关的信令消息。

1 概述

  通用MPLS(GMPLS)是MPLS向光网络扩展的必然产物,它为了适应对智能光网络进行动态控制和传送信令的要求而对传统的MPLS进行了扩展、更新。在智能光网络中,基于GMPLS协议完成是实现光网络节点控制平面的主要途径,光网络节点通过GMPLS协议可完成信令、路由、链路管理等功能,真正实现了光传输网与业务交换网的集成,为发展新业务创造了良好的条件。

  GMPLS对光网络生存性方面的支持主要体现在其为光网络的故障恢复机制提供了消息的处理机制,本文在描述了网络接点的运行状态后,对基于GMPLS的网络故障恢复过程进行了介绍,同时给出了相应的信令消息结构。

2 网络节点运行状态

  在由GMPLS协议所实现的光网络节点中,客户层的设备(如IP路由器)通过UNI接口与此节点上的控制平面相连,控制平面完成网络以及接点资源处理过程,在有业务请求时完成呼叫建立连接过程,在网络发生故障时则完成故障恢复处理过程,而其中的故障检测由传送来完成。具体的讲,网络各个接点其运行状态由以下五个任务构成:

A. 在全网络内定期发布本节点的链路状态信息,包括通道的可用性等。通道的状态信息包括三种:使用状态、未分配状态和保护预留状态。

B. 对新业务请求执行CAC(连接允许控制)步骤,并完成呼叫连接建立过程。

C. 检测网络故障并对失效的业务连接执行恢复过程。

D. 定期执行资源规划过程以确定是否需要增加新的通道以满足预定的业务和网络故障恢复目标。

E. 使用集中式或分布式算法定期地重新优化恢复路径。

  上述五个任务均由网络接点的控制平面完成。其中,任务B可分解如下:

B-1. 光网络节点(如OXC)通过UNI接口接收到客户层设备的业务连接请求,这种请求包括业务的一些属性,如带宽、故障恢复需求等;

B-2. 如果新的业务请求不包含故障恢复需求,则在有足够资源的情况下确定业务路径,否则拒绝连接请求;

B-3. 如果新的业务请求包含故障恢复需求,对于1+1保护请求,则建立保护连接;对于其他保护机制的请求,则预留相应的网络资源。如果没有足够的网络资源,则拒绝业务请求。

  而任务C(检测网络故障并恢复失效连接)可分解如下:

C-1. 检测网络故障,将检测到的故障信息发送到相关节点,通过一定的故障恢复机制恢复失效连接。故障检测过程由接点传送平面来完成;

C-2. 定位和修复故障;

C-3. 故障修复后将网络状态转换为正常态,即恢复到初始的连接状态或重新优化业务路径。

与网络生存性相关的任务包括A,C和E,其中任务E完成预计算备份路由的功能,涉及到具体的算法。对于任务B,即连接允许控制(CAC),ITU-T正在对这部分内容进行标准化过程中。

3 基于GMPLS的故障恢复

  本节对基于GMPLS的网络故障恢复过程以及相应的信令消息格式进行说明,分为故障发生前的处理和故障发生后的处理两个过程来描述。

3.1 网络故障发生前

  此阶段光网络节点控制平面主要执行任务A,完成链路状态信息收集的功能,从而得到网络的逻辑拓扑结构。GMPLS对开放最短路径优先OSPF协议进行了扩展,使之适合于光网络节点对链路状态信息的收集和管理。光网络节点的控制平面利用扩展的OSPF协议通过向相邻节点发送Hello包,主动和其他网元交换链路和容量信息,从而掌握全网状态。当链路发生中断或新增加链路时,网元节点向所有其他网络节点发出事件广播LSA。各个节点收到信息后,更新链路状态表,并重新计算各个节点可达性的最佳路由。

  GMPLS对OSPF的扩展是通过扩展不透明LSA(Opaque LSA)来实现的,具体的讲,是扩展了流量工程LSA(TE LSA)。原OSPF协议TE LSA的TLV对象中的值域V包含路由器地址和链路两种选择,其中链路包括链路类型、ID、流量工程权值(metric)、最大带宽、最大预留带宽等子TLV(sub-TLVs),GMPLS在此基础上,扩展了以下五个子TLV:

  链路ID,类型11,长度4字节;

  链路远端ID,类型12,长度4字节;

  链路保护类型,类型14,长度4字节;

  共享风险链路组SRLG(Shared Risk Link Group),类型15,长度可变;

  接口交换能力描述符,类型16,长度可变。

  当光网络节点控制平面使用这种拓展的、适用于光路计算的OSPF协议时,在光网络节点初始化和链路状态发生变化的情况下,通过扩展后的TE LSA,就可更新全网的链路状态信息,同时也可做到和标准OSPF路由协议域互通。

  上述五个子TLV中的风险链路组SRLG指的是,当网络发生故障时,位于相邻光网络节点之间的失效风险概率相等的一组光链路或光通道。通常一根光纤中的所有波分复用通道就是一个风险链路组,因为一旦光纤发生断裂,将影响其中的所有光通道。定义SRLG的目的就是为了在光网络中实现灵活多样的选路机制,实际上这也增加了选路的限制条件。例如,如果两条光路径上不存在任何公共的SRLG部分,则它们的路由将互不相关,这样就可以保证任何工作路由的失效都可被恢复。

  通过扩展OSPF协议,光网络中的每个节点都维护了一张本地资源表,表1是一个本地资源表的实例,此节点具有N个端口,同时每根光纤中有W个波长,表中的节点ID表示与此端口相连的对端节点的ID值;λi状态表示链路中第i条波长的状态,有四种状态:使用状态、未分配状态、故障状态和保护预留状态;SRLG组表示与λi相关的风险通道组。



  由上表可以看出,当网络的节点数比较多,同时每条链路中的波长数也很多时,在链路状态发生变化的情况下,利用TE LSA广播这样一张表将很耗时,容易造成网络收敛速度慢。为解决这个问题,可采用如下方法来解决:

  仅广播变化了的链路状态信息;

  由于λiSRLG组是固定的,广播LSA中可不包含此信息。

  光网络节点通过发送Hello包周期地与相邻节点交换链路状态信息,根据不同的算法需求,每个网络节点可以仅仅维护本地资源表,也可维护一张全网的资源表。

  在传送平面检测到网络故障后,包括节点故障和链路故障,此时控制平面执行故障恢复任务,即任务C。

3.2 网络故障发生后

  此阶段网络节点执行任务C,即故障恢复过程。一旦检测并定位了故障,就要采取相应的保护和恢复技术来进行故障恢复。GMPLS对光网络生存性的支持主要体现在相关信令和消息的提供方面,由于GMPLS扩展了原MPLS中信令、路由及流量工程等相关协议,同时扩展了标签的概念,新增加了链路管理协议LMP,使之更适合于光网络的管理,这就为快速恢复光网络故障提供了必要的支持手段。

  光网络生存性技术包括保护和恢复技术,GMPLS通过扩展RSVP-TE协议和CR-LDP协议,对这两类生存性技术提供了信令的支持。这两种协议不兼容,具有排他性,所以一个网络只能选用其中之一。这里通过RSVP-TE协议和LMP协议来描述网络故障恢复中的信令过程。

3.2.1 故障保护

  光网络层的保护分为复用段层(OMS)保护和通道层(OCh)保护,复用段层的保护一般是在相邻两个节点之间的链路上提供,而通道层保护则在一条光路径(lightpath)上提供,光路径可由若干网络节点构成。

n 复用段保护

  复用段保护机制涉及到四类信令消息:故障通知消息、故障确认消息、请求倒换消息和倒换响应消息,可带内通道,也可走带外通道。本方案中,故障通知消息和故障确认消息通过LMP协议来实现,而请求倒换消息和倒换消息利用RSVP-TE消息来实现。

  复用段保护的执行过程如下:

Step-1. 如果下游节点检测到链路故障,则向上游节点发送故障通知消息。

Step-2. 上游节点收到上报的故障通知消息后,向下游节点周期性地发送请求倒换消息,并等待响应。

Step-3. 下游节点收到请求倒换消息后,根据资源情况向上游节点发送倒换响应消息,消息内容包含拒绝和接受倒换请求,如果接受倒换请求,则将工作通道倒换到保护通道上。

Step-4. 上游节点根据收到的倒换响应消息,确定是否进行倒换操作。

如果是上游节点检测到的故障,则无需故障通知消息,它直接向下游节点发送请求倒换消息,即执行步骤Step-2至Step-4。

故障通知消息可通过LMP的故障管理消息ChannelStatus Message实现,其消息格式为:

::=



收到ChannelStatus Message的对端节点必须用LMP中定义的ChannelStatusAck消息回应,其消息格式为:

::=

其中,MESSAGE_ID_ACK对象必须是从ChannelStatus得到的。

请求倒换消息通过带有标签集对象(Label Set object)的RSVP通道消息(RSVP Path message)来实现,此标签集对象包括保护链路的标签。标签集对象(Label Set object)是GMPLS对RSVP扩展的内容之一,其格式为:



  其中Class-Num待定,而C-Type=1。本方案中,Action表示对标签集添加或删除相应标签的行为标识符;Label Type表示对象中所携带标签的格式和类型;Subchannel表示适合进行分配的标签,如波长、光纤等,4字节长度。在复用段保护过程中,Subchannel用来表示需要故障链路和进行倒换的链路。

  倒换响应消息可通过带有标签集对象的RSVP Resv消息来实现,其中标签集对象中的标签表示为由于资源原因而无法进行保护倒换的链路ID。在资源不可用的情况下,可利用通道错误消息(PathError message)进行响应。

n 通道保护

  通道保护是由LSP的端节点(即LSP的源节点和目的结点)配合完成的,与复用段保护不同的是,通道保护的光路径可能会经过多跳才能到达目的节点,因此在故障发生时需要中间节点也倒换到备用通道上。对于1+1通道保护,数据信号同时在两条不同的通道上传输,接收节点利用选择器(selector)选择一条好的信号,这种情况下不需要信令的支持。对于M:N通道保护,N条工作通道沿着不同的路径传输信号,M条备用通道被预留为N条工作通道的共享保护通道。

  总的来看,通道保护涉及到四类信令消息:端到端的故障通知消息、端到端的故障确认消息、端到端的倒换请求消息和端到端的倒换响应消息,可走带内通道,也可走带外通道。保护过程的执行步骤如下:

  Step-1. 光路径的中间节点检测到通道故障,则向源节点周期性地发送端到端的故障通知消息,并等待确认。

  Step-2. 源节点收到故障通知消息后,向故障通知消息的发起节点发送端到端的故障确认消息。

  Step-3. 中间节点受到端到端的故障确认消息后,分两种情况进行处理:如果不是端到端故障通知消息的发起节点,此节点查找链路连接状态表,继续向下转发此消息;否则,消息终止。

  Step-4. 源节点周期性地沿着保护路径向下一节点发送端到端的倒换请求消息,并等待响应。

  Step-5. 保护路径的中间节点收到端到端的倒换请求消息后,如果资源可用,则继续向下转发此消息,并等待响应;否则向上游节点发送资源不可用的倒换响应消息。在资源可用并收到下游节点的成功响应消息后,中间节点进行倒换操作。

  Step-6. 源节点根据收到的倒换响应消息,确定是否进行倒换操作。

  端到端的故障通知消息和端到端的故障确认消息可通过LMP来实现,这两类信令消息在上一节已经介绍,这里不赘述。

  端到端的倒换请求消息同样可用带有标签集对象(Label Set object)的RSVP Path消息来实现,可通过Label Type进行区分。其中的Subchannel表示需要进行倒换操作的光路径的标签。

  端到端的倒换响应消息可通过RSVP Resv消息来实现,此外,在资源不可用的情况下,利用通道错误消息(PathError message)进行响应。

3.2.2 故障恢复

  故障恢复能快速地响应故障并且有效地利用带宽,但通常需要进行动态资源建立和路由计算,因此比故障保护要花费更多的时间进行倒换。故障发生后,恢复过程可在光路径的源节点进行,也可在中间节点进行,这与故障恢复策略机制有关。本小节主要讨论复用段恢复和通道恢复,RSVP-TE机制可作为实现上述故障恢复的信令载体。

n 复用段恢复

  复用段恢复是指在发生故障的邻近节点上将业务倒换到备用路由上的过程。为支持复用段恢复,中间节点必须寻找一条新的LSP以替代失效的LSP。通常,复用段保护对那些跨越多跳或传输距离较长的LSP比较有利,因为对这些失效LSP只在故障发生的周围节点上进行重路由,因此可极大地减少由于故障通知等因素所带来的时间延迟。

  如果LSP的被保护部分是单跨段(span),即不经过任何中间节点,则一般的故障检测就能有效地启动恢复过程。如果多于一个跨段需要被保护,则必须有一套机制将故障发生和请求恢复的消息通过中间节点通知负责进行修复的节点。

  因此,除去算法方面的考虑因素之外,必须提供一套消息传送机制。GMPLS协议框架中的RSVP-TE协议可提供这样的机制来完成消息的传递。

  通知消息通过带有通知请求对象(RSVP Notify Request object)的RSVP通道消息(RSVP Path message)来实现,此对象中携带需要被通知节点的地址信息。具体格式为:



  请求倒换消息和倒换响应消息仍可按照3.1节中的消息格式来完成,即分别采用RSVP通道消息(RSVP Path message)和RSVP Resv消息来实现。

n 通道恢复

  通道恢复是在故障点周围将业务倒换到备用路由上,新的路由是由LSP的源节点确定,而且可能会重用原LSP的某些中间节点,但同时也可能包含另外的中间节点,这同计算出的新路由有关。对于精确跳数路由,流量工程的一些要求可被直接应用于路由计算,而失效链路或节点则被忽略。

  备份路由可按需计算(即故障发生时计算)或预先计算好并保存起来,当故障发生时通过查找备用路由表而得到。与前一种方法相比,后者提供了快速的故障恢复时间,但存在着当网络拓扑发生变化时备用路由过时的风险。通过周期性地重计算备用路由,在一定程度上可减轻这种风险。

  通道恢复仍需有故障通知消息以及请求倒换消息和倒换响应消息,这三类消息仍可采用上面介绍的携带有通知请求对象(RSVP Notify Request object)的RSVP通道消息和RSVP Resv消息来实现。

  通道恢复过程可由收到RSVP通知消息或RSVP Path Error message表明故障发生消息的节点来启动。根据IETF一些草案的建议,新的资源可采用“断开之前先建立”(make-before- break)的方式来建立,即新的LSP是在旧的LSP断开之前建立的,但这会带来一定的问题,比如重复的预留资源等。这个问题可通过使用LSP_Tunnel Session object和共享显式预留(Shared-Explicit reservation)的模式来实现。新、旧LSP在共有的节点处共享资源,在会话对象(SESSION object)中包含隧道端节点的IP地址、LSP的TUNNEL_ID、隧道输入节点的Extended_Tunnel_ID、隧道发送者地址和LSP ID等参数,这些参数可用来唯一地区分新、旧LSP,因而保证了在新资源的建立过程中不会将两条LSP共同部分的资源计为双份。

4 结束语

  本文探讨了基于GMPLS的网络生存性的实现机制,这方面的研究也是目前智能光网络领域中的一个研究热点,已经有许多相关的建议草案提交IETF进行讨论,但目前均未能形成标准,还有很多待完善的内容,所有协议还都仅仅是讨论稿。但无论如何,以GMPLS协议来实现光网络的智能化这样一个方向是不容置疑的,而基于GMPLS协议框架的光网络生存性也将是实现光网络智能化的一个重要手段。

摘自《光纤新闻网》
 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50