高速路由器的体系结构和关键技术
发布时间:2006-10-14 7:34:55   收集提供:gaoqian
□ 武汉烽火网络有限责任公司 邓里文

    一、高速路由器体系结构的演变
    路由器本质上是一种特殊的计算机,无论是高速核心路由器,还是边缘汇聚路由器或接入路由器大体由以下几个部分组成:系统硬件、包括嵌入式操作系统及各种协议在内的软件、网络管理系统。网管系统也属于软件,与操作系统和协议软件的区别是网管系统是路由器中的人机交互渠道,用户通过网管系统控制整个路由器以及实现用户所需的功能。由于路由器是由硬件和软件组成的,因此,在设计路由器时,速度与可编程性是必须考虑的两个重要因素。
    到目前为止,路由器的发展过程大体经过了6种体系结构。早期路由器由通用CPU和共享总线相连接的线卡组成。所有从线卡进入系统的数据包通过共享总线送至处理器,由处理器处理数据,然后作出转发的决定。随后数据包再次通过共享总线送至目的线卡的接口,然后供传输到网络的下一站或目的网络。
    随着网络速度的增加,共享总线结构不能令人满意地按比例增加,成为IP数据网络的瓶颈。为了缓解互连瓶颈,在线卡中增添了处理器,这些处理器就地处理、转发大部分IP数据包,不再借助于主CPU,有效地将转发功能分布到每块线卡上。这样,大部分数据至多通过共享总线一次而不是二次,从而减少了总线上的业务量。
    随着网络速度的进一步增加,上述采用增加CPU的共享总线结构不能满足实际的需要,开始涌现出新的系统,即以交换结构替代共享总线。交换结构以高出CPU几个数量级的速度传送IP数据包,而且可用分布式处理器进行处理,因而消除了互连瓶颈。
    采用交换式结构,消除了互连瓶颈,但线卡处理器又成为新的瓶颈。于是出现了一种新方案,该方案采用了名为转发引擎的专用CPU卡来处理和转发IP数据包。在这类系统中,线卡仅发送信息包的报头,通过交换结构传送到转发引擎,由它作出转发决定,并将处理结果返回线卡。线卡再将IP包转发至相应的输出端口。在这个方案中,CPU仅处理一部分IP数据包,其余的数据包则直接通过高速交换结构从一个接口传送至另一个接口。任何无须CPU干预、直接在接口间进行传送的那部分IP包处于快速通路中,而任何需要CPU处理的IP包处于慢速通路中,慢速通路的数据包包括IP报头、控制包和异常包。
    尽管转发引擎结构极大地提高了效率,但不断增加的速度远远超过了通用CPU满足该要求的能力,这样就要求尽可能多地将数据传入快速通路。于是,线卡上的通用CPU让位给了高速、固定功能的ASIC。通过采用高速、专用ASIC,大大减少了CPU的负担,这样,大部分IP包完全可使用快速通路通过系统,只有控制包和异常包需经慢速通路转发至CPU。但采用固定的ASIC,在提高效率的同时,付出的代价是降低通用CPU固有的可编程能力。在速度或可编程性两方面难以适应IP网络高速发展的要求。于是出现了一种名为网络处理器(NPU)的器件,它既可用于线卡的快速通路中,类似于固定功能ASIC;又具有更高级的编程能力,类似于通用CPU的功能,它在速度和可编程方面都又优良的表现,大量采用高性能的网络处理器是当前路由器的发展方向。
    二、网络处理器
    不同的网络处理器具有不同的速度、可编程性和功能。网络处理器的基本功能是以线速转发数据包。数据转发功能包括分类与执行,分类指的是网络处理器检查数据包并确定如何进行处理和转发的过程,而执行指网络处理器按分类结果完成数据包的转发过程。首先网络处理器根据用户编程规则对输入的数据包进行封装。其次,网络处理器根据用户可编程算法校正输入的数据。第三,对数据包进行处理,根据有关协议规则转发数据包。第四,网络处理器提供用户可编程的统计生成,以便跟踪快速通路流量的分类结果。
    网络处理器具有下列数据通信功能。首先,它提供用户可编程缓冲器管理,可根据缓冲器管理算法作出转发/丢弃决定。其次,网络处理器提供业务量整形功能,可根据调度算法调度数据包的传输。第三,网络处理器能实现数据流修正。数据流修正包括数据流内的数据处理、报头与报尾的增加或删除,根据相关协议对数据进行封装、分段。所有数据流修正单元都是完全可由用户编程的。
    目前,网络处理器能够处理的速率包括100Mbit/s以太网、GE、155Mbit/s、622Mbit/s、2.5Gbit/s和10Gbit/s POS的接口速率,而且可以保持线速转发。目前,较流行的网络处理器有:
    Agere——Agere公司的NPU,包括快速图形处理器(FPP),路由交换处理器(RSP),和Agere系统接口(ASI)。它是一种平台处理器的解决方案,可以处理多项第二层的协议,处理速度可达OC-48的水平。Agere处理器的结构并不是依据RISC的构造,而是完全为分组处理应用重新设计的。
    C-Port ( Motorola ) ——C-Port公司的C-5处理器,它有16个RISC芯核,32个串接数据处理器,和5个经过针对不同作业的需要,优化过了的处理器卸载。C-5可以执行第七层以下的分组分类作业,速度为5Gbit/s。
    IBM已经开发了两种平台NPU。用于高端的NPU,命名为Rainier。Rainier的集成度很高,有16个RISC处理器芯核,和一个嵌入的MAC和/或POS成帧器。低端应用网络处理器为Charm,它是以RISC为基础的处理器,Charm是以企业的LAN和WAN接入作为应用对象。
    其它网络处理器包括Intel的IXP1200、Maker(Conexant)的MXT-4000系列和MXT-5000系列、Sitera公司的Prism、MMC的nP3400等。此外,市场上有些路由器中所用的网络处理器是有关公司自行开发的。
    三、高速路由器的关键技术
    如前所述,路由器中包含了大量的协议软件,路由器的各种功能都是通过有关协议来实现的,如将数据分组的IP协议,提供可靠数据传输的TCP协议,进行路由选择的RIP、IGP、BGP、OSPF等。IP最初的思想是能够实现各种物理网络的无缝连接,因此,为了使IP数据能够在各种物理网络上传输IP数据,开发了相应的协议。由于IP是目前通信业务的主要增长点,而且IP也已经成为公认的未来通信的统一平台,因此,作为IP网络的核心设备的路由器中的关键技术之一是如何支持物理层中的光纤通信技术,为此开发了多种技术,这些技术的实现方式都是通过高速路由器中的有关线卡来实现的。
    1.IP over ATM
    路由器中IP over ATM是通过采用各种ATM线卡来实现的。IP over ATM的基本原理是将IP数据包在ATM层全部封装为ATM信元,以ATM信元形式在信道中传输。当网络中的交换机接收到一个IP数据包时,它首先根据IP数据包的IP地址通过某种机制进行路由地址处理,按路由转发。随后,按已计算的路由在ATM网上建立虚电路(VC)。以后的IP数据包将在此虚电路VC上以直通方式传输而下再经过路由器,从而有效地解决了IP的路由器的瓶颈问题,并将IP包的转发速度提高到交换速度。IP over ATM技术的难点是如何将IP的无连接与ATM的面向连接到技术有机结合起来。IP over ATM技术众多,可以分为两种模型:重叠模型和集成模型。
    2.IP over SDH
    高速路由器中的IP over SDH(POS)是通过其上的POS线卡实现的。IP over SDH有两种方式:一种是IETF定义的采用IP/PPP/HDLC/SDH结构的IP over SDH,另外一种为ITU-T X.86/Y.1321定义的采用IP/LAPS/SDH结构的POS。
    IETF定义的POS的基本思路是将IP数据报通过点到点协议(PPP)直接映射到SDH帧,省掉了中间复杂的ATM层,这样可大大节省网络的投资。具体作法是先把IP数据报封装进PPP,然后利用高层数据链路控制(HDLC)成帧,再将字节同步映射进虚容器(VC)包封中,最后加上相应的SDH开销,置入STM-N帧内。在该方案中,PPP协议提供多协议封装和差错控制及链路初始化控制等功能,而HDLC帧格式负责同步传输链路上的PPP封装的IP数据帧的定界。
    IP/LAPS/SDH结构的POS是由武汉邮电科学研究院代表中国向ITU-T提出的,该方案兼容PPP,与IETF定义的POS相比,具有硬件开销少,工作效率高等优点。
    3.IP over WDM/Optical
    IP over WDM基本原理和工作方式是在发送端将不同波长的光信号组合(复用)送入一根光纤中传输,在接收端,又将组合光信号分开(解复用)并送入不同终端。IP over WDM是一个真正的链路层数据网。高性能路由器通过光ADM或WDM耦合器直接连至WDM光纤,由它控制波长接入、交换、选路和保护。IP over WDM的帧结构有两种形式:SDH帧格式和千兆以太网帧格式。
    光纤通信能够提供巨大的网络带宽,是所有网络传输的基础(有线传输)。在物理层采用光纤通信如WDM已经是人们的共识。同样在第三层采用IP也是大势所趋。由于传统的光纤通信主要是为了解决电信网即采用TDM技术的电话网通信带宽问题,随着IP成为事实上的网络统一标准地位的日益确定,自然就产生了一个问题是如何将IP和光路(Optical)有机地衔接起来,即实现IP over Optical(IPO)。目前国际上对IP over Optical的研究十分火热,IETF成立了IPO工作组正在制定有关标准,IETF已经有多个相关的草案。IP over Optical的实现方式目前讨论比较多的两种方式是IP/MPλS /WDM以及IP/Digital Wrapper/WDM。其中WDM代表Optical,当然也可以是将来的OTDM的光纤通信技术。
    IP over Optical的网络模型,其中MPLS(Multi-Protocol Lambdas Switch)信号和路由选择位于光网络中。
    在光网络的路由和交换上使用MPLS,特别是以MPLS的方式来控制WDM/DWDM,以波长作为标签,称为多协议波长标签交换(Multi-Protocol Lambda-label Switching:MPLmS)。MPLmS具有以下优势:可以实现对光网络带宽的管理和对交换光网络的光信道进行自动保护倒换;利用现有的MPLS和IP协议的软、硬件资源以及应用经验,避免开发新协议高投入的弊端;可以利用MPLS较为容易地实现流量工程,优化网络性能;对光网络单元和电(数据)网络单元的互操作性标准协议的开发具有极大推进作用;通过光域和电域的规范统一的网络管理和控制,简化业务提供者需要进行的网络管理工作;可以在IP路由器上最终实现DWDM复用,大大提高通信容量,为建立光因特网铺平道路。
    MPLmS网络中,支持标签交换的IP路由器(LSR)连接光核心网络,光网络由若干OXC通过光链路相互连接而成。OXC由光层面的交叉连接设备和控制平面组成,具有数据流交换功能,交换由可配置的交叉连接表控制。目前,OXC节点交换需要进行光电转换,在电域进行。随着光开关和可调谐激光器等技术的进步,将来它可以实现全光交换。控制平面使用基于IP的协议和信令进行节点的可达性检测、控制建立和维护端到端的光通路。LSR的数据平面通过标签互换实现标签包的转发,即通过各个LSR上“<{入端口,入标签},{出端口,出标签}>”的对应关系将打上标签的包(FEC)映射到由这些标签序列确定的标签交换路径上。而在OXC的数据平面上,也通过“<{入端口,入光信道},{出端口,出光信道}>”的对应关系将数据流映射到特定的光通路上。当使用WDM时,上述对应关系中的光信道即可由光波长来表示。OXC和LSR的控制平面都包括有资源发现、分布式路由选择以及连接管理的功能:一个是发现、发布、维护关于OTN的状态信息,根据光网络流量工程的策略和规则建立和维护光通路;另一个则发现、发布、维护与MPLS相关的状态信息,根据MPLS流量工程的策略和原则建立维护LSP。
    4.EOS
    EOS为Ethernet over SDH的缩写。由于SDH和以太网分别为电信网和IP数据网(局域网)中占据了绝对优势的技术,在向统一于IP的“三网合一”的下一代网络演变的过程中,如何保护全世界原来的上千亿美元的投资就显得十分重要。此外,由于实际证明以太网是传输IP的最好技术之一,如何扩展以太网的传输距离也是一个重要的问题。目前ITU-T已经定义了一种EOS技术,该标准由武汉邮电科学研究院余少华博士提出,标准号为X.86。该技术有着广泛的应用,既可在传统的SDH设备中提供以太网接口,也可在传统的以太网2/3层交换机中提供SDH接口,此外,还可以用一种设备直接将以太网和SDH两大网络连接起来。武汉邮电科学研究院开发的F-Engine AM1001 EOS接入设备就是这种设备。

 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50