IP网络内容分发技术
发布时间:2006-10-14 8:05:58   收集提供:gaoqian
聂秀英


  摘要 与传统的PSTN不同,IP网络主要为用户提供基于服务器/客户端的非对称的数据业务。由于IP网络服务的无地域性和无国界性,在用户数量达到一定程度时,用户对信息的消费会给包含有受用户欢迎的信息内容的服务器造成巨大的压力,同时造成接近于这些服务器的骨干网络的拥塞。最近几年内作为解决这些问题的内容分发技术成为业界的研究热点之一,本文主要介绍目前IP网络上较多采用的CDN(content distribution network,内容分发网络)技术、组播技术和端到端技术等几种IP网络内容分发技术。

  关键词 内容分发网络 信息服务 端到端通信

  1、概述

  进入2l世纪,IP网络上的信息越来越多,人们对信息的需求也越来越多。尽管IP网络的传输带宽越来越宽,用于存储内容信息的服务器性能和容量越来越高,但人们依然抱怨信息网络的传输速度低,获得的信息不够准确、不够快。造成这种现象的原因是作为信息存储媒体的服务器性能(存储容量、存取速度)的提高速度赶不上众多用户提取信息的需求。目前,视频信息占IP网络上传输信息总量的很大一部分。为了解决这个困扰业界的内容分发问题,研究人员尝试采用各种方式。本文将从信息业务存在的问题入手,介绍几种IP网络上的内容分发技术。

  2、IP网络上的信息服务存在的问题

  与PSTN主要提供交互式端对端对称的电话业务不同,IP网络主要提供服务器到客户端的非对称数据业务。IP网络上的信息服务方式基本上是由用户向存储有各种信息的服务器申请其希望得到的信息,由服务器根据用户的请求向用户发送其欲得到的信息内容。IP网络上最受用户欢迎的Web业务是一种基于服务器/客户端的业务,其业务模型如图1所示。


图1 以服务器/客户端方式提供信息服务的业务模型


  从图l中可以看出,在每一个web网站存储有不同信息内容的情况下,由于IP网络本身访问的无地域性和距离性,分布在世界不同地点的用户均可以到相同的服务器中访问内容,这样一方面会造成服务器本身的处理速度的瓶颈,另一方面会造成骨干网络业务量的拥塞。

  VOD业务是一种主要向用户提供视频信息的Web业务,由于其信息服务器中所存储的信息以视频信息为主,因此处理速度及拥塞问题尤为突出。为解决这两个问题需要有很好的内容分发技术。简单的思路便是将作为信息源的服务器分布式配置,使用户尽可能地“分散”访问,以减轻个别服务器和局部骨干网络的压力。但是,将信息源分布放置后,会出现如何管理内容信息在这些服务器中的存放,用户如何找到其欲访问的信息源的问题。

  3、内容分发技术

  基于客户端/服务器方式的非对称的数据业务的大量应用,会造成网络不同方向和不同局部的业务流量的不平衡,特别是服务于所有用户的服务器的压力尤为突出。为此人们便开始研究各种解决IP网络内容分发问题的技术。下面主要介绍用于内容分发的CDN技术、组播技术和端到端下载技术。

  3.1 CDN技术

  CDN是构建在IP网络之上的内容发布网络,其主要目的是通过该网络的构建减小IP骨干网络的传输压力,将连接到IP网络上的内容信息更迅速地分发到全球范围内连接到IP网络上的用户终端。CDN技术最先应用于全球范围内最受欢迎的Web网站。如图2所示,CDN网络主要由初始服务器、分布在网络“边缘”的缓存服务器、重定向DNS服务器和内容交换服务器组成。其中,初始服务器负责完成生成服务器信息内容;缓存服务器负责存储初始服务器的部分或全部信息内容;为用户进行地址解析的DNS服务器判断出用户所访问的网站采用了CDN技术进行内容分发时,将用户申请内容解析用的URL信息转发给重定向DNS服务器,重定向DNS服务器根据接收到的URL信息、转发URL的DNS服务器的地址信息以及网站在构建CDN时缓存网站的配置情况,将距离转发URL的DNS服务器最近的缓存网站的IP地址发送给DNS服务器,DNS服务器再将接收到的IP地址信息转发给用户,最终用户利用所接收到的IP地址完成与其“较近”的缓存网站的连接,通过接受“就近”的缓存网站所提供的服务达到减轻骨干IP网络的传输压力、提高服务质量的目的。


图2 CDN组网示意


  CDN的内容交换服务器和内容管理服务器为选用部分,其中,内容交换服务器主要配置在一个物理地点具有较多的缓存服务器情况下,完成各缓存服务器之间的负载均衡等功能;内容管理服务器主要完成整个CDN中各缓存服务器中存储的内容的管理,为各缓存服务器制订各自相应的缓存策略,以提高缓存服务器的服务质量。

  目前,IETF在CDN方面已陆续发布了一系列相关的标准,主要的标准有:

  IETF RFC3040(2001)Internet Web复制和缓存分类、IETFRFC3466(2003)内容互联(CDI)模型、IETFRFC3568(2003)已知内容网络(CN)请求路由机制、IETF RFC3570(2003)内容互联(CDI)场景等,分别规定了CDN(CN)的模型、应用场景、复制和缓存分类以及请求路由机制等方面的技术内容。

  虽然CDN技术已经应用于Web网站和VOD业务等方面来解决内容分发问题,已经有一些可以商用的设备,但从技术的角度上来讲还有一些需要改进的方面。例如:在重定向方面包括有DNS重定向和最短接收时间重定向两种方案,采用DNS重定向服务器实现重定向时,实际上最终选定的缓存网站是距离为用户进行地址解析的DNS最近的网站,而不是距请求用户最近的网站;采用最短接收时间重定向方式是指用户向所有的网站发送请求,最先接收到响应的网站被认为是距离用户“最近”的网站,但由于IP网络本身的信息流量的不确定性,最先到达的响应信息并非一定来自距离用户“最近”的网站。另一个问题在于内容存储策略,目前还没有一种非常有效的缓存信息内容的机制,通常情况下,本地采用两种信息存储方式:存储用户点击率最高的信息或根据对信息的分析选择近期是热点的信息。但这两种方式并非是最佳的选择策略。策略选择的好坏直接关系到提供业务的服务质量和对骨干网络带宽的压力。

  3.2 组播技术

  在内容分发方面存在两个瓶颈,一个是占用骨干网络传输带宽问题,另一个则是作为信息源的服务器的并发处理能力问题。目前存储器的存储容量不断提高,单位存储容量的价格下降很快,但相对而言,从存储器中存取信息的速度提高得不够快。因此,若为请求相同内容的用户同时发送一份信息将大大减轻服务器的存取压力。这种方式类似于广播电视所采用的方式,不同点在于广播电视采用无线方式传输,只要用户接收设备所采用的频率与发射机发射信号时所采用的频率相同,用户便可接收到发送的信息。在以有线传输为主的IP网络上,不可能向所有的地址均发送相同的信息,为此通常是选择一组地址来作为信息的接收者,也就是说,采用组播的方式来实现同时向一组用户同时发送信息的目的。

  早期利用IP组播主要是在IP网络上的会议业务,其实现方式是在普通的IP网络上架构了MBONE网络,加入到MBONE的用户可采用组播的形式发送信息,同时可以接收采用组播形式发送来的信息。其工作原理是组成MBONE的路由器均具有组播功能,同时进行组播通信的端到端所经过的路由器均为组播路由器。当IP网络上的路由器均具有组播功能时,MBONE将成为IP网络的一部分而不再作为独立的网络存在。在利用路由器所具有的组播功能进行组播通信时,主要的技术难点在于:(1)用户如何找到进行组播发送的源;(2)组播源用何种方式建立组播树。

  在提供组播业务时可采用两种实现方式。一种是利用组建IP网络的具有组播功能的路由器提供对一组用户的组播,信息源仅需将需要进行组播的信息发送给具有组播功能的路由器,组播路由器将为该信息所提供的组播组编号返回给信息源,信息源将该组播组编号向拟获得该信息的用户公布,用户通过加入相应的组播组编号加入到组播组从而接收到发送到组播组的组播信息。另一种实现方式是,信息源将信息发送到一个内容分发设备,并将欲发送到的用户的地址信息发送到该分发设备,由该分发设备将信息同时发送到列表中的所有用户,完成组播服务。

  目前在IP网络上所提供的视讯直播节目是采用IP网络所具有的组播功能向用户提供的。为保护信息拥有者的数字版权,受控组播将是使用的主要方式。目前在一些国家正在进行在移动网络上提供流媒体业务的试验,为保持越区切换媒体流的连续性,在流媒体直播时,采用多地点组播方式来实现。

  若组播组用户的数量较大同时用户的分布比较分散时,组播技术通常与CDN技术一起使用,利用CDN技术组建CDN网络,由初始信息源将信息组播到缓存信息节点,各缓存信息节点将接收到的信息再以组播的方式转发到用户,从而减少主干网络的拥塞和减轻信息服务器并发处理的压力。

  3.3 端到端下载技术

  上述两种内容分发技术实施的主体通常是网络运营商,内容分发技术的使用费用通常较高。考虑到目前用户所使用的计算机能力(存储能力和信息存取处理能力)较强,同时用户所拥有的巨大的存储空间通常处于闲置状态,若能将这些闲置的存储空间和处理能力利用起来,就可以在不增加用户使用费用的同时增加巨大的网络能力,同时用户也可以在将自己的计算机能力贡献出来的同时将自己的信息与其它人共享。为达到此目的,便出现了像BT一类的软件,利用该类软件可以实现用户和用户之间直接进行信息互换的对等通信。

  采用端到端通信的方式进行内容分发有两种形式:纯端到端的对等方式和桥方式对等通信。

  纯端到端的对等方式如图3所示。在该方式下,用户向周围用户询问是否有其所要的信息,根据所收到的应答消息,选择向存储有所需信息的用户中的一个请求发送信息。


图3 纯对等方式通信


  图3中,用户Tn向周围的用户T1、T2、T3、T4和T5发送查找某种信息的请求,若先收到T1所发送来的信息,该用户便开始从T1处下载所要的信息。若在此之后用户Tn又接收到来自其它用户的应答信息,该用户将拒绝接收。

  桥方式对等通信如图4所示,其工作方式是所有拥有信息的用户均登录到称为桥的服务器,该服务器将登录上来的用户所拥有的信息和用户所在的IP地址均发送给登录来的用户,供用户选择。


图4 桥方式对等通信


  在图4中,所有的用户在登录到桥服务器时均将自己愿意向其它用户发送的信息一同发送到桥服务器,然后,桥服务器将其它用户传送来的可以提供的信息目录发送给登录的用户,由用户选择到某一个或几个用户处下载所要的信息。若所要下载的文件较大时,相应的软件负责将文件分割成若干个小碎片并由分散到各处的用户分别下载并存储在各自的存储空间内,桥服务器负责将存储有碎片的用户信息通知到需要下载该文件的用户。用户下载了相应的碎片后在本地按次序将碎片组装成一个完整的文件后即可使用。

  采用端到端对等方式下载文件时,需要拥有信息的用户在线,同时需要拥有信息的用户自愿向其它用户发送其所具有的信息,用户需要花费一段时间查找拥有信息的用户。

  采用桥服务器方式进行端到端对等下载时,假如一个较大的文件被分割为小碎片并存储在不同的用户终端内,而下载信息的用户从某一个用户处下载信息尚未完成之前该用户关机或离线,那么下载信息的用户将可能无法获得该文件的所有碎片,从而无法使用该文件。其补救措施可以是通过桥服务器到其它存有该部分信息的用户处下载。

  此种方式的内容分发通常是按照用户自律和用户自愿的方式进行,对网络运营商而言还没有一种利用该服务获利的方法,同时内容提供者的内容信息的数字版权也不能很好地保护。

  4、小结

  内容分发技术是目前IP网络上的许多需要进行信息共享类应用必备的一种技术。实现内容分发功能的技术的使用成本和应用效率会直接关系到一些应用是否可以普及,如VOD。

  本文中所介绍的三种内容分发技术各有其优点和不足。采用CDN技术的内容分发方式具有一定的可管理性,可以提高业务的服务质量,减轻骨干网络的传输压力,但目前还没有能被普遍采用的缓存服务器内容更新策略。当前的做法是CDN的具体实施者根据各自的经验选择更新缓存服务器的策略,如存储在特定时间内用户点击率最高的信息,或者存储某段时间内可能是用户最需要的信息,删除那些已经过时的、用户不再需要的信息。实现这些策略需要做的统计管理工作量相对也较大,CDN设备对于提供多是免费服务的ICP而言价格相对较高。基于组播的内容分发技术实现内容分发时,信息可以在同一时间内发送到多个需要该信息的用户。但该种方式或者要求构建IP网络的路由器具有组播功能,或者要求配备有具有较高处理能力的设备来完成信息多地点发送功能。另外无限制的组播会给网络增加很多的业务流量。采用端到端(peer to peer)通信的内容分发方式可以灵活地利用用户设备所具有的富余能力向其它用户提供服务,从而解决网络中部分区域的网络拥塞和部分受欢迎的服务器处理能力不足的问题,但该技术在业务管理、赢利方式、用户对业务的获得和贡献不均衡、知识产权保护等方面存在一些没有解决的问题。

  除了每种技术存在的特殊问题外,三种技术还具有共同的问题,这就是对信息的处理和知识产权保护问题。内容分发技术是IP网络上许多应用普及的必备技术之一,该类技术的发展和推广使用将会促进相关产业的发展。

  
摘自 泰尔网
 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50