网格的数据传输协议
发布时间:2006-10-14 3:55:44   收集提供:gaoqian
彭定


  网格中已有许多大型的存储系统。这些存储系统往往侧重于不同的需求,为客户提供不同的服务:如高性能存储系统侧重于实现快速传送存储设备和并行机或群聚计算机之间的庞大文件;分布式文件系统则侧重于支持海量存储与负载平衡。

  由于采用了不同的软件及数据访问协议,大部分存储系统并不兼容。若要访问多个存储系统,应用程序必须采用多种方法来检索所需数据,这显然是低效的。在具体应用中,许多地理上分布的应用程序或用户需要访问大量数据,要求各种存储系统之间能快速而有效地传输大量数据。一种简单的解决办法是通过建立一个客户层或者网关,给用户提供统一接口以打破由相互不匹配的存储系统协议所造成的分区。这种方法不要求供应商支持一种新的协议,但由于增加了一个抽象层,所以实现跨系统数据传输的代价较大,且实现这种方法是一项很复杂的工作。为此,Globus提出了GridFTP机制,它基于标准FTP协议,并对其进行了全面扩展,可实现对多种存储系统的支持,并提供统一的用户访问界面。

  一、GridFTP协议功能及特点

  GridFTP基于标准的FTP协议。这是因为FTP协议是目前因特网上使用最普遍的数据传输协议,它具有如下特点:

  PTP协议有大量的技术基础,且易于理解。FTP协议是数据传输的标准协议之一,易于扩展体系结构,且支持一些扩展的动态发现。目前已有针对FTP协议的大量扩展及其实现,其中一些对于Grid环境的数据传输很有用。除了客户服务器传输,它也支持由第三方用户控制的2个服务器之间的直接传送。由于数据及控制信道在不同套接字上相分离,这使并行及条状传输等特征更容易扩展。

  在FTP协议及其扩展所定义的特征中,标准的FTP实现一般只支持其中一个子集。为了使网格数据传输协议具有更好的适应性,GridFTP除了应具有普遍使用的数据传输协议所提供的基本功能外,还必须是可扩展的。为了满足网格的需要,GridFTP在FTP的基础上增加了如下一些新的特征,其中一些已经成为标准。

  二、GridFTP性能

  在2台工作站上进行GridFTP数据传输的性能测试。其中一台工作站在美国Illinois州的Argonne National Laboratory,另一台在美国California州的Lawrence Berkeley National Laboratory,二者之间通过ES-Net进行连接。二个工作站都运行Linux操作系统,具有数据读写速度约为60MBps的RAID存储系统,在2台工作站之间最慢的网络部分是千兆以太网。

  Iperf是测量网络性能的工具,通过它可以得到网络的最大吞吐量。当并行TCP流达到7-10条时,GridFTP的通信性能可达到200Mbps。Iperf及GridFTP之间的性能差异主要是由GridFTP中存在的安全鉴别开销、发送性能状态信息的开销及检查点设置开销引起的。根据计算,GridFTP的性能可达到Iperf性能的78%。 在一段时间内,当传输过程中出现不同的网络问题时,传输性能会陡降。但当网络恢复时,数据传输又继续开始。这主要是因为GridFTP协议支持数据传输自动重传,这样一旦网络恢复正常,中断的数据传输可继续进行。

  三、GridFTP的发展前景

  GridFTP 2.0版本已基本能满足网格需求,预计2-3年内GridFTP将成为主要网格数据传输协议。然而GridFTP协议还有一个主要的问题:数据信道的连接与数据流必须在同一个方向上,也就是说数据信道不能是双向的。在防火墙中这将引起问题。因此GridFTP还需要一些附加特征及其开发技术,如全双工协议、管道指令和Web服务等。

  为了解决上述问题,Globus工作组将开发附加协议。GridFTP协议实际上是由许多下一层的子协议组成。这个新的数据传输协议将实现双向数据传输、管道指令、扩展块模式的所有功能和其他可能的特征。此外,GridFTP还要有一个统一的Web服务接口。如果需要向下兼容,新协议可以作为一个新的模式整合到现存的GridFTP协议中。


----《通信世界报》
 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50