(宁夏数据通信局运维部 刘君)
IP over DWDM作为一种新兴的网络技术,虽然备受瞩目,但也受到来自各方面的怀疑和挑战。其中最重要、最本质的问题是IP over DWDM网络是否能够满足电信业务的需要。这通常意味着两方面的要求,一是网络必须稳定可靠;二是服务质量保障。就是要求网络在出现局部故障时具有根强的故障恢复能力。
1、 网络的自愈能力
由于DWDM目前还是点到点的传输技术,网络管理和保护的措施还不完备。所以,传统的电信商认为,SDH仍然是网络中不可缺少的一层。但是,技术总是在演进中不断变化和发展的,DWDM和IP技术的演进和融合正在逐步侵蚀和动摇着SDH作为电信支撑网络的地位。SDH自愈环是SDH技术中最值得骄傲的一项功能,也是唯一能保证在50毫秒内从故障中恢复的技术。虽然使用SDH自愈环意味着损失一半的网络资源,但自问世以来一直被电信专家所推崇。
IP over DWDM网络依靠两个协议层完成自愈保护:传输层和IP层。
在DWDM层实现自愈保护,不但恢复速度可以保证小于10-2秒,而且会使IP网络的路由保持稳定,避免路由震荡。但是,目前DWDM的保护对网络资源的要求较高。如多条光纤,甚至多条光缆,也就是说。在DWDM层实现自愈保护的成本较高。
IP层自愈保护功能是IP网络中的一个基本功能。最原始的IP网络设计中就已经考虑了网络状态的动态变化,并设计了完整的动态路由规则。但是,完全依靠路由协议实现IP网络自愈恢复所需的时间都以分钟计,这样低的切换速度在超高速网络上会导致网络数据大量丢失,同时也无法满足电信业务对于服务质量的要求。
将IP网络设备与传输设备集成为一体是解决IP层通路检测速度慢的一条途径,但这种方法似乎与开放式互联系统的原则相矛盾。如果采用开放式传输网络平台,IP层就必须具备检测通路能力。而IP层的通路检测通常使用路由协议的链路检测机制,检测速度约为60秒。现代的路由技术通常会结合低层的检测机制,实现快速的迂回路由。
图1所示的网络拓扑,当Router 3与Router 5之间的链路中断时,Router 3通过传输层检测获得中断信息后,会立即向全网发送UPDATE信息,通知所有的节点有关该链路的状态变化。因此,Router1也会很迅速地获得Router 3-Router 5的中断信息,但因为Router1需要重新同步和计算路由,然后才确定选择Router 4作为新的传输路径,所以这种方式实现的迂回路由速度通常以秒计。
以电信服务的观点,秒级的自愈速度还不令人满意。为了使IP网络达到电信级的服务标准,IP设备的供应商们做出了不懈的努力。不但推出了MPLS流量工程,更推出了称为Fast Rerouting的技术,可以使IP网络的自愈恢复速度降到50毫秒以内。
MPLS流量工程在源和目的地路由器之间同时设置两个隧道。如图2中的Router 1和Router
5之间同时配置tunnel 1和tunnel 2。其中一条隧道tunnel 1置为active,tunnel 2置为standby。Router
1在收到发往Router 5的业务流时,会发现有两个tunnel可以选择。由于tunnel 1处于active状态,所以Router
1自然首先选择tunnel 1。而当线路中断时,Router 1立即将数据切换到tunnel 2,而无需进行数据库同步和路由计算等处理。因此,切换速度仅为几十到几百毫秒。这种方式的缺点是需要增加1倍的隧道管理开销;优点是无需为备用的隧道预留带宽资源,这显然比SDH的50%带宽资源开销更加经济实用。
——Fast Rerouting要求的网络结构比较复杂,网络拓朴必须如图3所示配置。当Router2-Router
3之间的链路中断时,Router 2会利用Router 2-Router 4之间的迂回链路将发往Router 3的业务直接送往Router
4。Router 3也同样会利用Router 1-Router 3之间的迂回链路将发往Router 2的业务直接送往Router
1。因为这种结构可以保证所有链路的中断都可以在本地完成恢复过程,而无需通知远端,而且切换只发生在物理层,与上层业务无关,无须记忆任何状态或进行任何业务过滤,所以这种保护方式完全可以达到与SDH自愈环一样的效果。但其缺陷也是显而易见的,它比SDH环的结构复杂,网路资源开销大。
2、网络的服务质量保证
对于IP网络的另一个严峻挑战是如何保证服务质量。传统的IP网络只提供Best Effort型业务支持。IP网络作为支撑所有电信业务的统一网络平台,如何满足各种电信业务对于服务质量的不同要求,是IP网络产品需要解决的一个关键问题。
利用IP包头中的TOS字段区分和识别业务是路由器常用的方法:而WFO和WRED则是路由器目前普遍采用的保障QoS方法,保障QoS要求路由器有两个处理环节:一是发送处理,二是阻塞时的丢包处理。在实际的网络环境中,交换机并不能保证业务以线速通过交换机,复杂的网络业务量模型、动态的流量分布都会造成网路频繁地瞬时阻塞。阻塞一般分为二个等级;轻度阻塞、严重阻塞和完全阻塞(参见图4)。
在网络利用率达到一定程度时会产生轻度阻塞,这种状态是网络的最佳状态,因为这时网络在保证服务质量的同时,承载的业务量也达到顶点。所谓严重阻塞就是网络业务量已经达到或超出网络所能承受的范围,而完全阻塞是指业务量完全阻塞了网络,网络已经无法正常工作。轻度阻塞、严重阻塞和完全阻塞之间的界限并没有严格的规定,不同的厂家对其有不同的定义。但不论他们如何定义阻塞等级,对于阻塞的处理方法都大致相同:
1)排队:出现阻塞意味着有数据需要缓存,排队就是一种缓存数据的方法。排队是根据一定的策略将业务分别缓存,这是一切QoS或CoS处理的基础和前提。
2)根据队列的优先级决定发送数据的策略,如WRR (Weighted Round Robin)或MDRR(Modified
Deficit Round Robin)。通过为高优先级业务提供更多的转发机会可以保证轻度阻塞时业务的服务质量。
在出现严重阻塞时,网络必须丢失一定的数据以缓解阻塞,以免出现进一步阻塞。可以根据优先级丢弃数据,如采用WRED机制。
如果有选择地丢弃数据仍未能控制住网络的业务量,而使网络进入了完全阻塞,网络将被迫丢弃几乎所有数据。如果这种情况频繁发生,对于网络将是致命的。
为了改变传统IP网络中业务流量无序分布的状态,避免网络局部阻塞,于是IETF推出了MPLS流量工程。
3、MPLS流量工程
如果网络规划得不合理,可能会造成网络局部阻塞。MPLS流量工程通过指定部分业务的路径,解决网络局部阻塞问题。
Traffic Trunk(以下简称TT)是MPLS流量工程中一个非常重要的概念。Traffic
Trunk也称Traffic Tunnel。TT是一个同类业务流的“集合”,在单一业务类别的模型中,TT可以在入口LSR和出口LSR间封装所有业务流。就像ATM的VC一样,TT是一个可选择路由的实体。TT和MPLS中的LSP是相互独立的,TT可以从一个LSP转移到另一个LSP中。另外,MPLS流量工程目前规定TT是单向的。一个双向TT可以用两个相关联的反向TT构成。
Traffic Trunk的操作和维护
MPLS目前还未确立建立和拆除TT的信令协议,扩展的RSVP建议是厂商目前普遍采用的信令协议。
建立TT有两个途径:人工配置和自动生成。自动生成路径还可以作为人工配置的补充手段,当人工配置的路径中断时,通过自动生成,TT可以恢复通信。
人工配置要求TT的建立信令支持源路由。与PVC的建立过程不同,TT的建立过程是由网管对TT的源端进行配置,而由源端用信令发起建立。这样,在TT所经历的路径出现断路等故障时,源端就可以自动完成迂回路由的功能。
——“自动生成”要求与该TT相关的各节点支持“基于QOS的路由”。当节点自行决定TT的路径时,它期望网络能够根据当时的网络运行状况为TT选择一条最佳的路径。
以图5所示的网络为例,R1在发现业务流出现阻塞后会试图建立一条新的TT,以分流部分业务量。但在完成传统的SPF算法后,R7-R4已被剪断,留给R1的只有一个选择——最短路径R1-R2-R3-R4-R5(但此时已非最佳路径)。基于QoS的路由选择是将QoS参数作为路由选择的依据,改变以往SPF算法中只用metric(只参照链路带宽)作为剪枝依据的方法,而是根据网络可用资源的分布状况,首先将不满足QoS要求的枝剪去,然后再用“延迟metric”(利周可用带宽等信息计算出的metric值)进行SPF运算。完成这一过程的先决条件是必须具备一个触发QoS路由算法并提供QoS参数的手段。目前建议中采用RSVP
PATH信息来完成这一功能。
扩展的RSVP就是在原有的RSVP基础上增加源路由能力,加上原有RSVP PATH信息中的资源预留能力,扩展的RSVP就满足了作为TT建立信令的要求。
除了建立信令外,TT的操作和维护还需要拆除、中断检查和恢复等一系列信令相配套,RSVP则早已具备了一套完善的体系。
目前。MPLS流量工程主要采用人工指定路径的方式,基于约束的路由在实现上还没有完全成熟。所以全网单纠妙也依靠流量工程支撑所有业务在网络管理上去相当复杂。根据MPLS协议的设计宗旨,MPLS流量工程只是MPLS网络的一个功能,或者称为一种工具,并非MPLS的全部。MPLS还有一套更完善的体系可用来支撑各种业务,特别是Best
Effort业务。但目前宣称支持这种体系的只有Cisco和Nortel。
4、链路协议
在DWDM传输平合上直接承载IP,仍然需要解决的一个问题就是链路管理问题。当前可选用的链路管理方式有两类:Ethernet和PPP/HDLC。Ethernet起源于传统的局域网技术,随着Internet的发展,接口速率已由传统的10M/100M发展到今天的1000M。传输距离也在不断地扩展,特别是全双工交换技术的使用,更可以解除传统Ethernet对于网络设计半径的约束。但由于原Ethernet主要应用于局域网或城域网。所以其链路管理相对较弱。当前正在讨论制定的10G
Ethernet标准已经开始加强链路管理功能,预计10G Ethernet标准将于2002年出台。
PPP/HDLC是IP的传统的链路管理协议,它保证IP在广域网络上传输的可靠性和安全性。PPP的链路质量监控功能提供了一种检测专用(租用)线路故障的方法。有时专用线路传输质量下降,并超过了特定门限值而下能进行可靠的数据传输,但路由器可能从物理的观点仍然认为线路是好的,这样会造成数据的丢失或破坏。使用LQR功能,使网络管理员可以定义可接受的质量等级,如果链路质量下降到低于门限值,路由器能够重新选择路由。
IP over DWDM要解决的另一个重要问题是如何在传输网络与IP设备间建立信息互通的纽带。两个层面的脱离会使IP层无法从传输层直接获取网络连接状态,而只能依靠高层的链路检测协议(如OSPF的HELLO、RSVP的KEEPALIVE),这些检测手段判别通断的时间一般都以秒计,甚至以分计,而且提高检测速度还意味着更大的网络带宽开销,同时会增加网络路由震荡的危险。所以,依靠传输层检测网络连接状态是非常必要的。一些IP设备厂商和传输设备厂商已经开始在这方面做出努力和尝试,他们分别从各自的产品出发,试图在原有的产品上集成所有的功能,从而将两个协议层的技术紧密结合起来。采用这种方式的典型技术有:Cisco的DPT和Lucent的WaveStar宽带管理器。
摘自《中国数据网》
|