视讯技术现状及发展趋势
发布时间:2006-10-14 4:14:46   收集提供:gaoqian
信息产业部电信研究院总工程师 蒋林涛


  摘 要:近几年来通信环境发生了巨大变化,原来制约视讯业务发展的通信资源紧缺和价格昂贵等因素已不复存在。相反,随着宽带网的迅速发展和高速无线接入技术的发展,要求寻找与网络技术相适配的业务,市场的需求将导致视讯业务的发展。目前存在的主要问题是:视讯业务体系结构及制定视讯业务相关标准问题,本文就分组网上视讯会议和视频点播业务体系的特点作了讨论,提出了相关看法和注意事项。

  关键词:通信业务、视讯会议、视讯点播、多媒体业务

一、概述

  视讯技术已经谈了很多年,早在20世纪60年代人们就开始谈及可视电话,我国在20世纪70年代初就做出了可视电话的样机,并成功地进行了实验室范围的通信,但时至今日视讯业务仍没有获得广泛应用。视讯业务没有走进寻常百姓家的主要原因是受到通信条件的制约,特别是传输资源紧缺和价格昂贵,接入技术单一、落后,行业垄断严重。近几年来,通信环境发生了巨大的变化,原来制约视讯业务发展的通信资源紧缺和价格昂贵等因素已不复存在,相反随着宽带网的迅速发展和高速无线接入技术的发展,要求寻找与网络技术相适配的业务,视讯业务恰恰符合要求,于是近两年来视讯业务成了业内人士讨论、研究发展的热点。

  视讯通信业务可分为两个技术分支:一个是会议和会话型业务,其中包括点对点的可视电话和多方参加的视讯会议;另一个为视讯点播业务,最为常用的一种形式称为视频点播(VOD,Video on demand)。

  视讯会议和会话业务是一种对称业务,工作方式是点到点(可视电话)或多点之间(视讯会议)交互通信。视讯会议和会话业务是一种实时业务,由于是一种人于人之间的交互通信,系统的任何一点时延就会立即被用户所感知,因而它是一种实时要求相当高的业务。 视讯点播是一种检索型业务,是一种人与计算机之间的交互通信,工作方式是多点到点。视讯点播也是一种实时业务,但其实时要求远低于视讯会议,它对系统的要求主要表现在对时延抖动(jitter)有一定的要求,要求能满足在播放的过程中信息流连续供应。

  两种视讯业务在实时性要求方面的差异,导致了两类运动图像编码的产生:MPEG系列的运动图像编码和H.26X系列的运动图像编码。MPEG系列的运动图像编码专门用于视讯点播业务,它的特点是图像编码压缩率高,但编码时延长;H.26X系列运动图像编码是专门用于视讯会议业务的,它的特点是图像编码压缩率较MPEG低,但编码时延短。

  除了实时性方面的差异外,这两类视讯业务网的体系结构也是不同的。视讯会议是一种面向连接的业务,在业务活动开始前首先要建立二点之间或多点之间的连接,只有在连接建立之后才能进行业务活动。只要二点之间连接建立,可视电话即可开展业务活动,其间不涉及第三方设备;视讯会议是多方通信,必须借助第三方设备(MCU)来组成多方连接及多方的信息有序交换,视讯会议同样是连接建立后即可开展业务活动,连接拆除则业务活动完成。一般来说,视讯会议设备间的关系比较简单,一次会议业务中只涉及很有限的设备。视讯点播业务就不一样,在视讯点播的业务过程中,不是一个面向连接的业务过程,视讯点播的业务过程有:用户鉴权、目录浏览、节目检索与节目播放等过程。对于视讯点播系统,还需要节目制作、节目分类、目录索引、节目导航系统、分布式节目存储等。可见两者业务过程和系统功能差异颇大,因而这两类视讯系统网络体系结构也存在着很大不同的。 视讯业务虽然已经谈了很多年,早在20世纪60年代人们就开始谈及可视电话,但时至今日会议和会话业务尚未获得广泛应用,可见通信的可视化其难度之大,影响通信可视化商业应用的主要因素有两个:一个是信源编码与其实现技术,另一个是通信信道的传输能力与价格。

  先来看信源编码与其实现技术。音频信号是一个窄带信号,即使不采用压缩技术也可以毫无困难地在通信信道中传输,因而音频编码不是障碍;视频信号是宽带信号,以CIF格式的彩色图像为例,不压缩的图像码率为352×288×50×3×8=121.65Mbit,这样的码率要在信道上传递的确是有困难,视频图像必须要进行压缩编码才能进行传输。视频图像编码早就提出来了,这么多年来,基本原理没有发生很大变化。视频图像编码的基本原理为:为了消除图像的帧内相关性,要对图像进行帧内编码,目前主要使用的帧内编码技术是离散余弦变换(DCT);为了消除图像的帧间相关性,采用运动矢量预测补偿算法,这项技术被证明是行之有效的,它可以使预测帧(P帧)的码率大大低于基本信息帧(I帧),从而有效地实现了帧间压缩。近年来,随着微电子技术的飞跃发展,特别是数字信号处理器(DSP)的运算速度的迅速提高和存储器容量的高速增加、价格的迅速下降,图像编码算法的实现余地大大加强了,尽管帧间编码的算法(运动矢量预测和补偿算法)并没有发生很大变化,但随着预测精度的提高,编码效率也大大提高。帧内编码与帧间编码后的数据信息还有冗余,还要进行熵编码进一步提高编码效率,目前熵编码技术主要有霍夫曼编码和自适应算术编码。

  信源编码曾经是阻碍视讯发展的很重要原因,因为视频编码的复杂度和当时器件的能力,尤其是微电子器件的能力远远不能满足视频处理的需要。受器件的影响,在相当长的一段时间内(从1970年至1990年初),信源编码影响了视讯技术的发展和普及。进入90年代后,情况发生了相当大的变化,用于视讯信源编码的国际标准化工作已基本完成,微电子技术的突飞猛进式的发展,视讯设备的大规模商用化已成为现实。90年代中叶以后,特别是近年来微机性能的大幅度提高,在一台高档微机上,增加少量硬件已经可以构成一台性能优良的视频终端,在这种情况下,信源编码及其实现已不再是阻碍视讯发展的原因。

  再来看影响视讯业务开展的另一个主要原因,即通信网的传输能力及价格。近年来,光通信技术的高速发展,DWDM技术的广泛商用,高速以太网的广泛应用以及各种高速接入技术的不断出现,使得通信网的传输能力有成数量级的提升,相应也导致通信网的传输价格大幅下降,普通用户已经有能力使用视讯业务。

  国内已经组建了中国电信、中国网通、中国联通、中国移动、中国铁通、中国卫通等六个大型全业务电信运行企业,中国电信一家垄断电信市场的格局被打破,六大公司竞争的格局已经展开。竞争的结果必将导致网络规模的进一步扩大和价格进一步下降,这将为用户使用视讯业务提供更好的通信环境。

  目前,中国六大电信运行商中没有一个运行商拥有完整的电话网,特别是没有通达千家万户的电话本地网。电话业务是电信运行商的赢利重头,是运行商必争的业务。从电信运行商的业务发展策略来看,拥有一个完整的电话网是他们首要的目标,新兴的运行商要建设新的电话网,老牌运行商由于分拆的缘故,要重新建设暂时不拥有的本地电话网。为顺应技术发展趋势,他们不可能再用传统的技术去建设本地电话网,而会用新的技术去建设他们的本地电话网。专家认为建设以宽带IP城域网为基础的本地网,在发展众多数据业务的同时,解决本地电话接入问题将是首选技术方案。基于这样的认识,可以预见在近一二年内,除了原已存在的上千万户的宽带网及数量庞大的企业网外,还会有更大数量的宽带网建立起来。宽带网建设可以满足Internet业务和电话业务发展的需要,同时也为视讯业务的发展提供了很好的网络环境。简言之,由于技术的发展和通信行业的竞争展开,国内通信条件改善很快,通信网的传输能力及价格已不再是影响视讯业务开展的主要原因。

  再从需求角度来看,在电话发明之初,人们就一直期望在通话音的同时也能看到对方的图像,这样在通话过程中更有亲切感,可以向通话双方提供语言无法传递的信息。社会调查也表明,绝大多数人愿意拥有可视电话,也愿意使用视讯会议。对于视讯会议,绝大多数企业都是十分感兴趣的,特别是一些跨地区的大企业更是需要,它不但能节省很多旅差费和人工费用,而且也是一种最及时、最方便的手段来解决异地间的信息交流问题。视讯点播业务在娱乐方面很重要,因为它能最大程度满足人们的个性化消费的需要特征,完全按用户的需求来提供视频信息。近年来随着宽带小区的发展,视频点播应用正在迅速扩大。

  社会有需求,运行商和设备制造商有积极性,影响视讯业务发展的两大因素均已突破,视讯通信发展时代即将到来。

二、视讯系统的体系结构

1.视讯会议的体系结构

  视讯会议业务作为一种重要的电信业务形式,一直受到电信专家的高度重视。国际电联(ITU-T)的专家长期以来一直致力于视讯会议业务的标准化工作,已经提出了一批视讯会议业务的标准。

  视讯会议业务系统与它的承载网密切相关,不同的承载网导致了不同的视讯会议业务体系,并不是所有的承载网都可以支持视讯会议,只有具有足够带宽、足够好的时延性能和具有端到端寻址能力的数据网,才可能成为视讯会议业务系统的承载网。迄今为止,可以作为视讯业务系统的承载网的数据网只有4个:ISDN、ATM、IP网和LAN,而PSTN不是数据网,它是以话带数据来传递视讯会议信息的。这些网络又可以分为两大类,一类是基于电路交换技术(TDM)的数据网,这种类型的网络只有ISDN,数字数据网(DDN)也是基于TDM的,但DDN只是一种基于配置的专线网,不具有端到端的寻址能力。另一类是基于分组交换技术的数据网,这类网现在有3个:ATM、IP与LAN。这两类网络,由于其交换机制完全不同,视频会议体系也有很大差别。

  基于电路交换网的视讯会议是最早进行标准化的,也是最早进行商用的视讯会议系统。基于电路交换网的视讯会议的标准是H.320,它是针对p×64K速率电路交换网的线路设计的视讯会议系统,具有p×64K速率交换能力的数据网只有ISDN,从理论上讲,H.320的网络环境只有ISDN,但是能全程调度(1~30)B资源的ISDN很少,目前广泛使用的基于H.320标准的视讯会议是由半永久连接的DDN(数值数据网)来承担的。

  电路交换网的特点是一旦连接建立,在该连接上的资源就固定为该连接的用户服务,网络资源是独占的,直至连接拆除资源才被释放为止;电路交换网的另一个特点是,它只能建立点到点的连接,不能建立一对多或多对一的连接;第三个特点是电路交换网的连接即是其物理连接,电路交换不存在虚连接。这三个特点决定了基于电路交换网的视讯会议系统的特点,由于物理连接即为其电路连接,在电路交换系统中不存在虚电路连接。一般地说,终端与视讯会议系统之间的物理连接只可能是一条,由于电路交换系统中不存在虚电路连接,终端与视讯会议系统之间的电路连接也只可能是一条,但是终端与视讯系统之间的信息交换有多种,有会议控制信息、媒体信息,媒体信息又可分为三种:视频、音频和数据。这些消息要在一条物理信道上传递,必须要采用复用技术,目前已经标准化的复用技术有比特交织法的帧结构复用(由H.320/H.221建议规定)和包结构复用(由H.324/H.223建议规定)。由于在电路交换网中没有虚电路的概念,复用只能用于点到点的范围。另外,视讯会议系统必须要有能够组成多方会议的能力,而电路交换网中不能提供多点之间连接信息交换的能力,于是在视讯会议系统中就要有一个被称为多点控制单元(MCU)的设备来实现多点信息交换的功能。多点控制单元(MCU)具有两大功能:一个功能是会议的多点控制(MC)功能,它的作用是在一个多点会议中进行会议控制和管理;另一个功能是会议中多点信息的处理(MP)功能,它负责多方会议的图像切换/复合和多方会议的声音混合。MCU的这两个功能在逻辑上是独立的,可以独立存在,不是一定要放在一起才成为一个设备。在电路交换的视讯会议系统中,MCU是与终端直接连结的,由于终端与电路交换网之间只可能有一条物理连接,而会议控制与媒体交换这两个功能在终端中是必须同时具备的,那么通过电路交换网与它直接相连的MCU也必须同时具有这二个功能,所以在电路交换的视讯系统中MC与MP是不分离的,它总是以MCU形式存在。由于在电路交换的视讯系统中MCU的不可分离性,为了合理使用传输资源,MCU通常是以层次结构的方式组织的,所以将对会议管理、数据传递时组播树的组织带来困难。电路交换视讯会议的体系结构往往是以MCU为核心的树形结构形式。电路交换环境下的视讯会议系统的主导标准有两个:用于ISDN(或DDN)环境的H.320和用于PSTN(用话带数据来传递视讯会议信息)环境的H.324。

  基于分组交换网的视讯会议标准化工作也已进行了相当长的时间,最早是对ATM视讯会议的标准化,对ATM视讯会议的标准有两个:一个是H.310,另一个是H.321。这两个标准随着ATM在市场上的变化而进行重大的起伏,从目前来看,ATM到桌面的可能性已微乎其微,因而H.310或H.321应用的可能性也很小,这两个标准的进一步工作已经完全停止。

  分组交换环境下的最重要的视讯会议标准是H.323。H.323最初是为在服务质量不保证的LAN环境下的会议系统而设计的,为此它在运输层(UDP)上的信道质量的检测和表示层媒体的处理上做了大量工作,以求在一个质量不保证的网上,为用户提供可以接受服务质量的视讯会议,或者最低限度来保持会议连接。随着IP技术及应用的飞速发展,随着H.323协议的不断升级版本,人们也认识到在一个完全不保证服务质量的网上是无法提供正常的视讯会议服务的,因而H.323标准的定位发生重大的变化,它不再是质量不保证LAN上的视讯会议标准,而是在分组交换环境下的视讯会议标准。从应用角度出发来考虑,它是目前惟一拥有大量商业用户的视讯会议标准。H.323已受到世界各国广泛重视。

  分组交换网用于视讯会议是有其特点的,这些特点决定了分组交换网上视讯会议的结构有别于电路交换网的视讯会议结构。分组交换网的特点是:它的网络资源是统计复用的,在分组交换网中,通信连接的建立并不意味着它将立即使用网络中的传输资源,网络并不为某一个连接保留具体的资源(如时隙、频段等),只有用户传送信息时,才真正占有网络的资源,并使用网络的资源。即使像ATM中的连接CBR流,网络也并不为它保留独占的资源,只是在它使用时才保证提供它所需的网络的资源。资源不独占意味着网络传输效率的提高,但当业务需要保证服务质量时,也将会加大网络节点的复杂度。另一个特点对视讯会议的结构会产生重大影响,即分组交换网中物理连接和电路连接不一致,在一个物理连接中可以拥有一个或者多个虚电路连接,这样当一个终端设备用一条物理线与分组交换网相连时,它可以同时支持多个虚电路连接,通过虚电路连接终端可以同时与多个设备进行通信。在分组网的视讯会议中,为了要进行多方会议,除了会议终端以外,还必须要有管理、控制和处理多方会议的设备,对于电路交换的视讯会议系统而言,这个设备是MCU,在电路交换环境中MCU是不可分割的。在分组交换环境中,由于虚电路的存在,终端尽管只有一条物理线与分组网相通,但它可以通过虚电路与分组交换网上的多个设备同时通信。因而,在分组交换网的会议系统中,MCU已经没有必要再以一个混合体的形态存在,而可以将原本是独立的两个功能块多点控制器(MC)和多点处理器(MP)拆开,成为会议系统中的两种独立设备。多点控制器和多点处理器设备构造是不相同的,一般地说,多点控制器可以用计算机与协议软件来构成,它与处理媒体无关,与用户数相关也不严格。多点处理器则是与媒体相关,它是由专用硬件构成的,与用户数密切相关。二者的分离无论从网络设计与网络优化都会有很大的好处,而且从制造业的角度出发更可以专业分工发挥特长。另外,由于分组交换网的虚电路的存在,使得原本对电路交换网中十分困难的会议管理变得容易。总之,分组交换网的特点使得分组交换网会议系统拥有电路交换网会议系统无法比拟的特点。

2.视讯点播系统的体系结构

  视讯点播已经不是一种新业务了,视讯点播中的一种重要业务形式——点播电视(VOD,Video on demand)早在10余年前随着ATM一同发展起来,国际上最大的点播电视网(基于ATM)在我国香港建成,曾有用户10余万户(1998年)。基于ATM的点播电视,国际DAVIC组织曾经做过很完整的标准,我国原邮电部通信行业标准中也有相应标准。近年来,随着IP网在我国的发展,特别是宽带网的大量建设,作为一种重要的娱乐手段,VOD在国内开始发展起来。从对承载网角度的要求出发,用于开展视讯点播业务的承载网至少要能同时支持两个连接,一个连接用于节目或内容的选择、控制,另一个连接用于节目或内容流的传送,对于电路交换网来说,由于两点之间的物理连线,只有可能产生一个电路连接,不能产生一个以上的虚电路连接,因而在电路交换网中很难进行视讯点播业务,尽管在电路交换网中二点之间可用比特交织组帧法或包结构法在一条物理链路中传送多种信息,但在电路交换网中,多类信息的共用一条物理线路传送只能限于点到点范围,不能在整个电路交换网内实现,所以如果一定要用电路交换网来实现视讯点播,所有用户终端必须首先接入AP(Access-point)设备,由AP点设备去实现多点媒体的处理和商业事务的处理。由于视讯点播业务是宽带业务,AP(Access-point)设备将会相当复杂且相当昂贵。正因为这些原因,迄今为止还无人作过尝试。

  对于分组交换网来说,它的特点是虚电路,由于虚电路机制的存在,用户终端到分组交换网的一条物理线上,可以有多条虚电路同时存在。对于视讯点播来说,这个特点非常有用,这个特点可以导致终端能同时与多个信息平面进行通信,从而完成论证鉴权和计费、节目的查询和视讯信息的传送。

  视讯点播业务是一种宽带业务,低速分组网是不能胜任的,可以承载视讯点播的可以是ATM网、IP网和LAN。从技术层面来讲,用ATM网来承载视讯业务是很合适的,它既可以提供灵活有效的选择信息内容方式,也可以提供能支持视讯业务的服务质量的传输机制。在ATM发展的全盛时期,基于ATM的视讯发展得也很好,而且制定了一个很完备的标准(由国际组织DAVIC制定的)。但由于ATM在商业上的不成功,特别是ATM到桌面的商业运作不成功(由于缺乏ATM业务),最终使得基于ATM的视讯点播走下坡路。

  用IP网来承载视讯点播业务也是很合适的。特别是近年来,IP网的骨干网传输速率随着光通信技术的高速发展成数量级的增长,IP宽带接入网的普遍建设,使得在IP网中开放视讯点播的条件越来越好。高速大容量存储及集群技术的发展,使视讯点播业务提供的灵活性也越来越好。IP网中的视讯点播系统由如下系统组成:用户接入与论证;目录系统,其包括目录生成系统和目录检索系统;分布式节目存储播放系统,这是一个分布式的宽带系统,是视讯点播的主系统,它向用户提供优质的视讯节目;网管系统;客户服务系统;节目版权管理系统。目前IP网中的视讯点播系统还没有业界一直认可的标准,国内没有,国际上也没有。由于没有统一的标准,设备厂家各自为政,不能互联互通,严重影响视讯点播业务的开展和进一步发展。针对国内的这种情况,IP与多媒体标准研究组正在着手制定标准,以期推进国内信息产业的发展。

三、结束语

  数十年来,人们一直在期盼着通信能有一个革命性的进展,人们一直在期盼图像通信进入人们的生活。由于信源编码与数字信号处理能力和通信网传输能力的限制,这些愿望一直没有达到。十几年前,随着ATM的兴起,视讯系统曾经有过一个高潮,但随着ATM在商业上运作的不成功,视讯系统陷入低谷。近年来,由于Internet的巨大成功,IP技术深入到各个领域,加上光通信技术的高速发展、高速以太城域网的发展,使得通信费用成数量级的下降,通信网向用户提供视讯服务的条件已经具备,发展视讯业务的时机已经来到。电话是最重要的电信业务,它为电信运行商带来巨大的商业利益,它仍然占着电信运行商90%以上的收益,电信从固定到移动,应该说是该想的都想了,该做的都做了。从电信运行商的角度出发,他们当然希望能出现一种能与电话一样赚钱的新业务。人们的感官有视觉、听觉和嗅觉,在日常生活中,视觉比听觉更为重要。由于视频信号的复杂性,通信只能先从声音开始,但视频图像毕竟是人们期盼的通信内容,一旦条件成熟视频通信是很快会应用起来的。目前,影响视讯业务发展的两大障碍:信源编码及其实现问题和通信网传输能力及价格问题已经克服,存在的主要问题是体系结构的标准化及其他相关标准的完备,目前这些工作正在进行之中。有理由认为,视讯业务将会很快形成一个发展高潮。

  作者简介蒋林涛:信息产业部电信研究院总工程师,IP与多媒体标准技术工作委员会主席,1970年毕业于清华大学无线电系,1982年获清华大学电子工程系数据通信专业工学硕士学位。长期从事多媒体、数据通信、IP技术的研究开发和标准制订工作,国家“863”通信主题多媒体专业专家组一、二、三届成员。1992年获国务院颁发的政府特殊津贴,1996年获“中华人民共和国有突出贡献的中青年科学技术专家”称号。


----《中国多媒体视讯》
 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50