浙江工业大学信息工程学院 翁格奇 包建荣 章波焕
摘 要:本文主要论述了基于Internet视频会议技术的概念、原理。通过压缩编码技术和IP网络传输来实现视频通信的形式,IP视频端到端的几种方式,及网络的基本构成和各部分设备的主要作用,重点讨论了最新视频传输技术的协议规范H.323标准、H.261标准、H.263标准和SIP标准及其实现与网络相关的技术,并讨论了视频通信网的关键设备-VoIP网关和软件接口界面的实现方式。
关键词:VoIP IP视频会议 H.323标准 H.261标准 H.263标准 H.263+标准 G.723标准 G.729标准 SIP标准 VoIP网关 网闸 服务质量Qos
一、前言
目前,由于电信网、有线电视网和计算机网的融合,视频通信将是极其重要的驱动力。虽然现有的电信技术和架构已能很好地解决人们通电话的问题,骨干光缆和电缆调制解调器的普及已大大提高了上网速率,基本满足了人们上网浏览信息的需要,但是,人们需要的通过网络自由、廉价地进行可视视频会议,通过网络点播全球任何地方的视频节目的要求却还远远没有很好的实现。
会议电视作为数字视频通信的先驱,已经发展20多年了,顺应三网合一的趋势,势必进入重要的转型阶段:即交互可视通信所依附的传输网络基础,由电路交换式的ISDN和专线网络向分组交换式的IP网过渡以及所针对的市场目标将由大型公司、机构会议室向小型的工作组会议室、个人工作桌面延伸,最终发展到家庭。由此,基于H.323的IP视频通信VoIP(Video over IP)已成为实现最新视频传输技术的最佳方案。VoIP技术可以把视频信号作为数据包在IP网络上实时传输,这些网络都遵循TCP、RTP和UDP协议。其系统架构的原则是:简化网络管理,发展功能健全,提供低成本的网络视频通信系统。无论是Internet还是私有网络,这些已经被使用的数据网基本上都是可以支持H.323标准的IP网络。
目前使用最为广泛且发展前景最好的多媒体业务主要是视频会议、视频点播及可视电话等业务,而实现这一系列业务的核心就是会议电视体系标准。ITU-T的H系列标准是为多媒体会议而制订的,其中包含了视频编解码、语音编解码、复用、控制信令及传输速率等内容。
二、IP视频会议的技术原理及相应网络基础
IP视频会议的技术原理主要是运用了由ITU-T提出的最新视频技术协议:H.323标准。并通过VoIP(Video over IP)技术得以实现。
VoIP是建立在IP技术上的分组化、数字化传输技术,其基本原理是:通过压缩算法对语音和图像数据进行压缩编码处理,然后把这些视频数据按IP等相关协议进行打包,经过IP网络把数据包传输到接收地,再把这些视频数据包串起来,经过解码解压处理后,恢复成原来的视频信号,从而达到由IP网络传送视频的目的。
在VoIP系统中,模拟语音图像信号被数字化,并以数据包流的形式通过数据网进行传送。IP网络允许数据报各自独立的寻找最佳路径到达目的地,因此在任何时候都可以最大限度的利用网络资源。来自同一源地址的数据包会以不同的路径到达同一目的地,数据包到达时顺序可能是完全混乱的,带有不同的延时或根本就不能到达。然而在目的地这些数据包会被重新排序(不能到达的数据包则重发)并还原为原始的视频信号。VoIP技术可以保证正确的还原视频信号,弥补由于延时所带来的断续和丢包等现象。具体实现上,用户建立通话连接过程见图1。
图1 用户建立IP视频通话连接过程
注:用户通过配置摄像头、麦克风、耳机的微机和视频会议必须的软件、硬件实现会议可视通信
VoIP的核心与关键设备是VoIP网关。VoIP网关具有路由管理功能,它把各地区视频会议电视地址映射为相应的网关IP地址。这些信息存放在一个数据库中,有关处理软件完成呼叫处理、数字视频打包、路由管理等功能。在用户拨打VoIP视频电话时,VoIP网关根据网络电话地址数据库资料,确定相应网关的IP地址,并将此IP地址加入IP数据包中,同时选择最佳路由,以减少传输时延,IP数据包经因特网到达目的地VoIP网关。VoIP视频会议通信的网络拓扑结构见图2。
图2 VoIP视频会议通信的网络拓扑结构
VoIP技术可以采用ITU-T H.323 v2标准。首先,面对的是IP网的带宽问题。作为经验值,可接受的图像质量要求384kbit/s的速率,即使利用H.263编码方式,也需128~256kbit/s。由于是交互式通信,加上网络传送的负荷,如数据的纠错,加密等附加信息的加入,一个实际的点对点的可视通话,可能要占据此带宽的2.5倍(800~900kbit/s)。所以若一个局域网内有若干个用户拥有视频终端,就需要网络升级为100Mbit/s,或至少是交换型10Mbit/s以太网。
其次,交互式通信对时延和抖动很敏感。H.323采用UDP作为传输层协议,并且引入RTP/RTCP协议来作为视频音频码流的同步机制,这些方法使局域网上的H.323通信具有较好的实时效果。但当网络中涉及到IP路由器,时延又成为一个制约因素。根据实际运行情况,路由器应采用OSPF等处理较快的协议,并且在企业网内,网络管理员应对其路由器进行专门设置,如RSVP,以确保网络时延在一定范围内。另外一个考虑是采用ATM作为骨干网来连接各地局域网。由于ATM是面向连接的技术,它可以很好地解决传输时延问题。而ATM和IP技术的结合,地址的转换,目前主要有两个解决方案:叠加模式和集成模式。叠加模型已由早期的IPOA、LANE发展到现在很热门的MPOA;集成模型也已由厂家专有的IP Switch等发展到IETF的MPLS建议。
三、IP视频会议通信的IP数据报编码原理与分析
IP视频会议通信主要采用三个技术:一是采用了压缩编码及基于TCP/IP的包交换技术;二是利用了具有统计复用的IP数据网;三是充分利用了现有的光纤传输技术,因此其资源占用率高。
IP视频信息以分组数据的形式在数据网中传输。因此,在视频终端和数据传输网络之间需要一个信源编码器,将连续的视频信号分割成一定长度的多个视频数据分组,并对其进行压缩处理,减小信源消息的多余度,降低传码率,提高传码的有效性。又因为采用基于TCP/IP协议的包交换技术,所以在传送前,将压缩后得到的数据封装到IP数据包中实现在IP交换网中的传输,因此网络上实际传送的码流并不是编码后输出净码流而是经过封装后的码流。它的一般封装形式为:在数据包前加上IP包头、UDP包头和RTP包头,通过增加这些冗余字节,达到寻址、提高可靠性等功能。封装的效率取决于一个RTP包中打多少数量的数据包。RTP包头所打的视频包越多,封装效率就越高,单位流量也就越小,电路利用率就越高,但同时,由于RTP包头所携带的视频包个数增加,单个IP数据包的传输时延(包括编码时延、打包时延、处理时延、网络时延、缓冲排队时延等)在一个视频来回的历时加长,全网时延就加大,给用户的感觉就是“对方迟钝”。因此,在设计系统时,需要在提高电路利用率和减少时延中做出选择,以达到两者的最优。
视频通信系统是通过信源编码和信道编码来提高信道传输消息的有效性和可靠性。
视频通信系统采用信源编码来压缩视频图像和语音数据的。当t1时刻到来时,检测到视频信号,此时再进行采样、量化、编码;当t2时刻到来时,检测到视频信号的渐渐衰落而进入抑制编码阶段,即编码间隔进行适当的调整,当视频信号消失时,编码间隔趋于无穷大,从而提高了编码效率。
信道编码是在信源编码的基础上,有目的的增加某些码元,使之具有纠错或检错功能,在IP视频通信中,就是在信源编码的基础上,在数据包前封装某些信息,例如寻址信息,使之能正确的传输到目的地。由于IP是基于TCP/IP协议的包交换技术,因此它在进行视频包交换时,每一个视频包前必须加上IP包头、UDP包头和RTP包头,这些包头如果采用某些压缩技术是可以达到提高网路利用率的目的, 但随之产生的误码也将会增加,可使用信道编码中纠错或检错方法来解决。
四、IP视频会议系统的网络构成
目前电信级VoIP系统一般由IP电话终端、IP接入网关、网关(Gateway)、关守(Gatekeeper)、网管系统、认证计费系统等几部分组成。
1.终端:IP电话终端包括传统的配置了摄像头、麦克风、耳机的计算机、即集语音、数据和图像于一体的多媒体业务终端。其中该计算机需要配置相应的软硬件支持模块,如用户视频会议通信的软件模块,视频(H.263,h.263+),音频(G.711,G.723,G.729)硬件编码,解码模块。
2.接入设备:接入设备即网络交换机,集线器等微机接入网络的设备,它的作用是接入网络,并与VoIP网关连接,使用户通过软件实现与其他视频会议者的通信。
3.VoIP网关: VoIP网关可以先对所需传送的IP视频通信的数据进行常用可靠加密算法如RSA,DES等加密(加密程度具体可以根据需要决定),以确保数据安全性,然后根据其数据报寻址信息(如虚拟的网络电话号码等),数据安全信息,正确可靠的把它传输到目的地—被叫用户的VoIP网关端,由被叫端的网关对IP数据包进行解密,还原为可被终端解码而识别的视频音频信号。这样,就完成了一个完整的电话到电话的VoIP电话的通信过程。
4.网闸(Gatekeeper):网闸实际上是IP电话网的智能集线器,是整个系统的服务平台,负责系统的管理、配置和维护。网闸提供的功能有拨号方案管理、安全性管理、集中账务管理、数据库管理和备份、网络管理等等。网闸按管理作用的不同又可分为目录网闸、区域网闸,整网通过目录网闸同其他IP电话运营网络实现互通。
5.网管系统:网管系统的功能是管理整个IP电话系统,包括设备的控制及配置,数据配给,拨号方案管理及负载均衡、远程监控等。
6.认证计费系统:认证计费系统的功能是对用户的鉴别用户是否为有权用户并对呼叫进行费用计算,同时提供相应的单据和统计报表。认证计费系统可以由IP视频会议系统制造商提供,也可以由第三方制作,但此时需IP电话系统制造商提供其软件数据接口。
五、VoIP的关键技术
传统的IP网络主要是用来传输数据业务,采用的是无连接的技术,因此没有服务质量保证,存在分组丢失、失序到达和时延抖动等情况。数据业务对此要求不高,但视频数据属于实时业务,对时序、时延等有严格的要求。因此必须采取特殊措施来保障一定的业务质量。VoIP的关键技术包括:信令技术、编码技术、实时传输技术、服务质量(QoS)保证技术、以及网络传输技术等。
1.信令技术
信令技术保证电话呼叫的顺利实现和话音质量,目前被广泛接受的VoIP控制信令体系包括ITU-T的H.323系列和IETF的会话初始化协议SIP。
ITU的H.323系列建议定义了在无业务质量保证的因特网或其它分组网络上多媒体通信的协议及其规程。H.323标准是局域网、广域网、Intranet和Internet上的多媒体提供技术基础保障。H.323提供设备之间、高层应用之间和提供商之间的互操作性。它不依赖于网络结构,独立于操作系统和硬件平台,支持多点功能、组播和带宽管理。H.323具备相当的灵活性,支持包含不同功能的节点之间的会议和不同网络之间的会议。H.323建议的多媒体会议系统中的信息流包括音频、视频、数据和控制信息。信息流采用H.225.0建议方式来打包和传送。
H.323标准中的重点是来定义呼叫连接过程。它首先引入了一个全新的会议系统元件:网闸(Gatekeeper)。网闸的主要作用是IP地址转换、带宽管理控制等与呼叫有关的功能。H.323呼叫建立过程涉及到三种信令:RAS信令,H.225.0呼叫信令和H.245控制信令。其中RAS信令用来完成终端与网闸之间的登记注册、授权许可、带宽改变、状态和脱离解除等过程;H.225.0呼叫信令用来建立两个终端之间的连接,定义了初始的呼叫控制(引用Q.931呼叫信令)和终端对网闸的登记、申请等功能。当H.225建立了初始呼叫之后,H.245规定了一系列握手信号来完成通道控制,当系统中没有网闸时,呼叫信令信道在呼叫涉及的两个终端之间打开;当系统中包括一个网闸时,由网闸决定在终端与网闸之间或是在两个终端之间开辟呼叫信令信道;H.245控制信令用来传送终端到终端的控制消息,包括主从判别、能力交换、打开和关闭逻辑信道、模式参数请求、流控消息和通用命令与指令等。
H.323版本2中对呼叫连接性又提出许多改进,如:增加了快速连接(Fast Connect),迭次传送(Overlapped Sending)等机制。另外,版本2还引入H.450来定义IP视频通信的附加服务,如呼叫转移和呼叫传送(Call diversion & Call transfer)等。
虽然,H.323提供了窄带多媒体通信所需要的所有子协议,但其控制协议复杂。此外,H.323不支持多点发送(Multicast)协议,只能采用多点控制单元(MCU)构成多点会议,因而同时只能支持有限的多点用户。而H.323也不支持呼叫转移,且建立呼叫的时间比较长。与H.323相反,SIP是一种比较简单的会话初始化协议。它不像H.323那样提供所有的通信协议,而是只提供会话或呼叫的建立与控制功能。SIP可以应用于多媒体会议、远程教学及Internet电话等领域。SIP既支持单点发送(Unicast)也支持多点发送(Multicast),会话参加者和媒体种类可以随时加入一个已存在的会议。SIP可以用来呼叫人或机器设备,如呼叫一个媒体存储设备记录一个会议,或呼叫一个点播电视服务器向会议播放视频信号。
SIP是一种应用层协议,可以用UDP或TCP作为其传输协议。与H.323不同的是:SIP是一种基于文本的协议,用SIP规则资源定位语言描述(SIP URL),这样易于实现和调试,更重要的是灵活性和扩展性好。由于SIP仅作于初始化呼叫,而不是传输媒体数据,因而造成的附加传输代价也不大。与H.323相比,SIP还有建立呼叫快,支持传送电话号码的特点。所以,SIP协议可以作为H.323协议的补充,用在简单的会话方面。
2.编码技术
话音压缩编码技术是IP电话技术的一个重要组成部分。目前,主要的编码技术有ITU-T 定义的G.729、G.723等。G.729、G.723都是混合编码方法。G.723是采用ACELP的编码方法。G.729是CS-ACELP的编码方法,可将经过采样的64kbit/s话音以几乎不失真的质量压缩至8kbit/s。由于在分组交换网络中,业务质量不能得到很好保证,因而需要话音的编码具有一定的灵活性,即编码速率、编码尺度的可变可适应性。G.729原来是8kbit/s的话音编码标准,现在的工作范围扩展至6.4~11.8kbit/s,话音质量也在此范围内有一定的变化,但即使是6.4kbit/s,话音质量也还不错,因而很适合在VoIP系统中使用。
视频图像压缩编码及传输则根据H.323标准采用H.263、H.263+系列编码标准。H.263+是在H.263基础上多了几个以选项形式存在的改进,如编码效率的提高、信道冗错增强等,从而更适用于易错低速率IP通信网络环境。
3.实时传输技术
实时传输技术RTP主要是采用实时传输协议RTP。RTP是提供端到端的包括图像,语音在内的实时数据传送的协议。RTP包括数据和控制两部分,后者叫RTCP。RTP提供了时间标签和控制不同数据流同步特性的机制,可以让接收端重组发送端的数据包,可以提供接收端到多点发送组的服务质量包馈。
4.Qos保障技术
VoIP中主要采用资源预留协议(RSVP)以及进行服务质量监控的实时传输控制协议RTCP来避免网络拥塞,保障通话质量。
IP网中引入视频通信后,服务质量可分成两方面:一方面是视频通信的质量,另一方面是原有的数据通信应用应该不受影响。H.323关守的带宽控制和管理功能保证了视频通信只能占用所有网络带宽的一个设定部分,因而不会冲击其他重要数据通信。
同时,H.323版本2增加了服务质量保证机制(包括RSVP)。当终端向关守提出允许请求信号时,可以指出其需要预留传输资源,关守因而向终端确认进行资源预留的可能性与渠道,以保证视频通信的服务质量。
5.网络传输技术
VoIP中网络传输技术主要是TCP和UDP,此外还包括网关互联技术、路由选择技术、网络管理技术以及安全认证和计费技术等。由于实时传输协议RTP提供具有实时特征的、端到端的数据传输业务,因此VoIP中需要用RTP来传送视频数据。在RTP报头中包含装载数据的标识符、序列号、时间戳以及传送监视等,通常RTP协议数据单元是用UDP分组来承载,而且为了尽量减少时延,话音净荷通常都很短。IP、UDP和RTP报头都按最小长度计算。VoIP话音分组开销很大,采用RTP协议的VoIP格式,在这种方式中将多路话音插入话音数据段中,这样提高了传输效率。此外,静音检测技术和回声消除技术也是VoIP中十分关键的技术。静音检测技术可有效剔除静默信号,从而使话音信号的占用带宽进一步降低到3.5kbit/s左右;回声消除技术主要利用数字滤波器技术来消除对通话质量影响很大回声干扰,保证通话质量。这点在时延相对较大的IP分组网络中尤为重要。
六、IP视频会议技术的关键设备VoIP网关
VoIP网关由数字信号处理器DSP、主处理器、全局RAM、以及以太网卡等设备组成。它在发送端将视频信号编码压缩后的IP数据包根据虚拟的网络电话地址,找到目的IP地址,以实现数据在IP网络的正确传输到目的地接收端,在接收端完成分组数据包的拆包得到压缩数据,并转向多媒体计算机网络电话终端,实现远程的互联和会议通信 。同时,根据用户保密需要,可以在VoIP网关设置加密解密模块,确保会议通信的保密性。VoIP网关通过交换机,路由器等连接分组交换网,如Internet、Intranet等,可实现接入网络的任意多台计算机的通信。在整个Internet视频电话系统中,VoIP网关分布在世界各地,处理当地的视频会议终端与Internet的接入和转发处理。网关接收标准视频信号,经数字化与压缩后,使用IP协议进行分组送到Internet,找出传输路由,通过Internet发往目的地。反之,接收Internet传输过来的数据分组,并转往网络电话终端,实现交互。接入和转出网络电话系统可同时进行,实现全双工通信。
七、IP视频会议技术的软件界面
在VoIP的PC用户接口需要设计相应的视频会议通信软件来实现。
图3 一种 PC机视频会议通信软件的界面
用户在拨打VoIP视频电话并拨号后,VoIP网关根据网络电话地址数据库资料,确定相应网关的IP地址,并将此IP地址加入IP数据包中,同时选择最佳路由,使IP数据包经因特网到达目的地VoIP网关并最终到达目的用户的VoIP终端而完成连接与视频通信。
八、IP视频会议技术的展望
IP视频会议技术以其低廉的费用及交互性视频传输的先进技术将受到人们的欢迎,而得到快速发展,相信,无论是在国外还是在国内,作为给企业、家庭等用户提供的一种廉价,高效的会议形式的选择,IP视频会议业务必将得到迅猛发展。而且,特别是在无线局域网等技术的发展,其IP视频会议终端也可以设置在移动计算机上,是视频会议技术表现出更大的灵活性与方便性。
----《中国多媒体视讯》
|