实时流媒体业务移动通信中的应用前景
发布时间:2006-10-14 4:14:29   收集提供:gaoqian
  北京博维时代科技有限公司 苏 劲 韩昌哲

  摘 要:本文介绍了未来移动通信网络流媒体系统结构及主要无线流媒体编码传输标准,并以基于MPEG-4视频编解码标准的无线实时流媒体通信解决方案为例,着重阐述了在未来移动网络上提供实时多媒体业务所将面临的诸多挑战及应对办法。 关键词:流媒体 MPEG-4 RTP/RTCP 抗误码工具

  一、前言

  根据EMC资料库提供的数据,到2003年年底,全世界已经有超过13亿用户在享受数字移动个人通信服务,到2010年,全世界移动用户的数量预计将会超过18亿。正是看到了这种极为迅猛的发展势头,各类科研机构、标准组织及电信制造商都将注意力放到推动数字移动通信技术进步及开拓新型数字移动通信业务上。而第三代移动通信网络则向人们展示了未来移动通信的发展方向及必经之路。

  第三代移动通信网络(3G)是从第二代移动通信网络(2G)演化过来的,同时又拥有许多更先进的无线接入技术,不仅继承了时分多址接入(TDMA)技术,还发展了一系列全新的码分多址接入(CDMA)技术,包括直接序列扩频宽带CDMA、多载波CDMA及TD-SCDMA(时分复用同步CDMA)等。正是由于引入了具有先天技术优势的CDMA无线接入技术,3G移动网络具备了高速数据传送能力。正如国际电信联盟(ITU)所定义的那样,3G网络应具备至少144kbit/s的数据传送能力,根据其具体运用的传输技术,可以实现从384kbit/s~2.4Mbit/s的速率甚至更高速率的数据传送。随着3G网络的不断延伸及最新无线通信协议的进展和先进3G通信设备的研制成功,无线运营商可以随时、随地为移动用户提供宽带数据发送及接收应用业务,这些应用业务包括视频、视讯会议、高保真音频及互联网接入等服务,而其中的许多服务都是基于无线实时流媒体通信技术之上的。

  本文介绍了点对点无线流媒体系统及相关最新的无线多媒体编码及传输标准,我们以基于MPEG-4视频编解码标准的无线实时流媒体通信解决方案为例,着重阐述了在未来移动网络上提供实时多媒体业务所将面临的诸多挑战及最新流媒体通信协议所给出的初步解决办法。

  二、无线多媒体业务编码及传输标准

  众所周知,电信系统之间的互操作性至关重要,而保持这种互操作性的关键就是需要制定电信设备制造商及运营商在制造产品及提供服务过程中必须遵守的开放标准。在提供无线流媒体方面,已经有数个音、视频压缩标准及基于包传输标准得到较充分的发展。而通过对视频编码标准的压缩效率、可扩展性、容错能力及占用的运算资源等因素加以折衷考虑,最适合目前移动通信技术及移动终端制造水平的应该是MPEG-4视频编码标准。

  1.MPEG-4视频编码标准

  MPEG-4标准的制定开始于1995年,于1999年2月MPEG专家组正式公布了MPEG-4(ISO/IEC14496)V1.0版本。同年底MPEG-4V2.0版本亦告完成,且于2000年年初正式成为国际标准,是第一个基于音视频内容或对象的编码标准,它从音视频场景中,按照人的直观感受分为若干个音视频对象,并分别对这些对象进行形状、纹理及运动矢量等编码,而不是象传统编码方式那样是基于像素进行编码。

  MPEG-4视频编码标准,作为MPEG-4标准的一部分,通常称为MPEG-4视频。它提供了大量视频编码工具,而这些工具都要占用一定的运算资源。为了降低MPEG-4设备的复杂度及成本,为了满足不同层次的应用,在不损失对端互操作性的前提下,MPEG-4定义了由对象类型,类(Profile)及等级(Level)组成的分级策略。MPEG的类规定了用于协同操作点(interoperability point)的技术,等级规定了一个类的范围或大小。在无线应用环境下,最常用的是简单视频类或简单可扩展视频类,这是由于相对更高类,比如核心类,这两个类占用的运算资源及带宽较小,比较适合应用于目前的无线终端。简单视频类采用矩形I帧和P帧,具有基于运动补偿离散余弦变换(DCT)基本功能的编码处理。I帧为帧内编码,而P帧为帧间编码,这两类编码方式是为了降低冗余信息。简单视频类同时具备可变比特率、压缩效率高及容错能力好等特性。简单可扩展视频类在简单视频类的基础上增加了对时域及空域可扩展对象的编码能力。

  2.音频编码标准

  在音频编码标准的制定上,目前无线多媒体标准组织将注意力集中到几个现存的蜂窝通信语音编码标准上。这些标准包括应用于GSM得到3GPP支持的AMR(Adaptive Multi-Rate)编码算法以及应用于cdmaOne得到3GPP2支持的EVRC(Enhanced Variable Rate Coder)编码算法,这两种算法都具有良好的抗误码能力。MPEG-4音频包括如MPEG-4 AAC(Advanced Audio Coding)等音频编码标准,以支持宽带、可扩展音频通信。

  3.流媒体网络传输协议

  流媒体的含义即按照实时或点播方式通过网络向通用媒介进行音视频广播,而面向连结的TCP需要较多的开销,故不太适合传输实时数据。流媒体传输一般采用实时传输协议RTP/UDP来传输实时多媒体数据。

  实时传输协议RTP被规定为在一对一或一对多的传输情况下工作,其目的是提供时间信息和实现流同步。为了获得较小的传输延迟,RTP通常使用UDP来传送数据,但RTP也可以在TCP或ATM等其他协议之上工作;RTP本身并不能为按顺序传送数据包提供可靠的传送机制,也不提供流量控制或拥塞控制,它依靠RTCP提供这些服务。实时传输控制协议RTCP和RTP一起提供流量控制和拥塞控制服务。在RTP会话期间,各参与者周期性地传送RTCP包。RTCP包中含有已发送的数据包的数量、丢失的数据包数量等统计资料,因此,服务器可以利用这些信息动态地改变传输速率,甚至改变有效载荷类型。RTP和RTCP配合使用,能以有效的反馈和最小的开销使传输效率最佳化,因而特别适合传送网上的实时数据。

  实时流协议RTSP定义了一对多应用程序如何有效地通过IP网络传送多媒体数据;RTSP在体系结构上位于RTP和RTCP之上,它使用TCP或RTP完成数据传输,通过SDP协议(Session Description Protocol)来传送与一次流媒体会晤相关的所有描述性信息。使用RTSP时,客户机和服务器都可以发出请求,即RTSP可以是双向的。

  4.第三代移动通信流媒体传输标准

  3G-324M作为3GPP提出的第三代移动通信流媒体传输标准,可确保有线视频传输系统与第三代移动视频传输系统之间的互操作性。它与ITU-T H.324中的视讯会议标准有较紧密的联系。3G-324M适用于UMTS移动网络中的64kbit/s电路交换链路,其复用协议为H.223、控制协议为H.245,缺省视频编码器采用H.263及MPEG-4简单类第一级,缺省语音编码器则为GSM-AMR和G.723.1。3GPP2也将类似的标准集应用于3GPP2无线网络电路交换视频会议业务。

  最近,3GPP采纳了基于IP协议的流媒体传输架构,该协议了规定了控制信令、背景描述、媒体传输、媒体封装及动静态图像、语音、文本的编解码等标准,推荐了RTP/RTCP作为MPEG-4视音频流媒体网络传输协议。

  三、第三代移动通信网络流媒体传输系统的关键特性

  在未来移动通信网络中提供实时多媒体服务需要面对诸多挑战,不仅要克服相对恶劣的无线传输环境,还要满足日益增多的基于IP的各类高速数据业务对无线流媒体传输系统在传输质量、传输速度及传输时延等方面上的要求。而第三代移动通信网络流媒体传输协议正是为了满足这些要求而设计的,它们具备的一些关键特性,为实现多媒体内容在无线网络上的实时应用提供了较为完善的编解码及传输平台。下面以基于MPEG-4视频压缩的流媒体传输标准为例,对这些特性加以简单描述。

  1.高压缩比及低运算量

  一般来说,无线信道所能提供的带宽或数据比特率是受限的,而且为移动服务所付费用与该用户在无线链路上传送的总数据量成正比,这就要求流媒体传输系统就在对流媒体进行编码时,要有较高的压缩效率,尤其对视频编码更是如此。相对于H.263标准,MPEG-4视频压缩标准简单类(Simple Profile)提供了包括宏块内4运动矢量,无限运动矢量,AC/DC帧内预测等视频压缩工具,从而可以较好地满足无线流媒体应用对高压缩比的要求。

  在选择视频编码标准的时候,不仅要考虑获得高压缩比,还要根据目前移动终端的硬件环境考虑到该标准的运算复杂度。H.264/MPEG-4 AVC包括了B帧和MPEG-4的简单类(Simple profile)更为精确、更为复杂的运动内插滤波。为了更好地完成运动估计, 4H.264/MPEG-4 AVC显著地增加了可变块尺寸的种类和可变参考帧的数目,这些都可以获得比MPEG-4的简单类(Simple profile)更高的压缩比。H.264优越性能的获得不是没有代价的,其代价是计算复杂度的大大增加,据估计,编码的计算复杂度大约相当于MPEG-4 简单类的3倍,解码复杂度大约相当于MPEG-4 简单类的2倍。采用较高计算复杂度的编解码标准不仅会提高移动终端的硬件成本,而且由于功耗的增加,减少了移动终端的通话时间,因此一般采用MPEG-4 简单类作为目前移动终端的首选视频编解码标准。

  2.传输速率可扩展性

  同时,为了适应各类应用对码速率的要求,同时依据所能提供的无线链路实际状况,音视频编码器应该能调整诸如帧的大小、帧频及解析度等参数。MPEG-4编码器就可以通过调整这些参数,使得编码后的视频流具备多样的数据速率,从而无线流媒体应用对编码器可扩展性的要求。表2列出了几种MPEG-4视频编码输出格式及相应的大致码速率。

  3.高容错性

  相对于有线传输信道,移动通信所要使用的无线传输信道环境要恶劣得多,数据包的接收误码率要高出几个数量集。而压缩视频流对误码非常敏感,即使接收到数据包的误码率很低,也会对解码后的图像质量造成很严重的影响,这是由于压缩编码去掉了原运动图像中所包含的大部分空间域及时间域上的冗余信息,即使编码后的视频流仅仅出现一个比特的错误,也会使得解码后的图像中有很大一部分空间域及时间域图像数据受到影响无法正常解码显示,而如果受数据包误码影响的帧是作为后面预测帧的参考帧时,造成一个数据包的误码会向后面的图像帧扩散,从而便得解码后图像质量的恶化情况更加严重。为了尽量减轻MPEG-4视频流对误码的敏感性,以保证压缩视频解压后的恢复质量,MPEG-4 提供了多种抗误码工具,承载流媒体业务的实时网络传输层及底层移动通信系统也可以进一步改善流媒体传输的抗误码性能。

  (1)MPEG-4抗误码工具

  包的重同步标志,每隔固定的比特数周期性地插入重同步标识,并在视频编码时去除两个不同视频包之间所有数据的依赖性。解码器在解码过程中识别到不可纠正的错误时,就会依据下一个重同步标志重新编码流同步信息,这样就减少了由于失步而不得不丢弃的数据量。

  数据分割(DP),使用运动边界标记(MBM)将视频数据分为运动部分和纹理部分,可以更严格的检查位移估值数据的合法性,主要用于误码检测及提高错误定位能力。

  头信息扩展编码(HEC),在视频码流中保护重要的头信息等,视频头信息可以在特定的视频包中重复发送。

  可逆的变长编码(RVLC),解码检测到误码后,可以从下一个重同步标识开始,反向解码直到误码处。

  根据传输信道的质量、系统需要提供的图像质量,以及在图像压缩效率和抗误码性能间的权衡,可以自适应地选择MPEG-4 中的抗误码工具

  (2)RTP/RTCP抗误码性能

  RTP/UDP/IP实时传输协议往往是以数据包作为传输单元。通常一个数据包的开销为40字节,典型包长约为1500字节。在接收端,可确保包内无误码,而丢失包也可以根据RTP序列号方便地检测到。音视频解码器可以不需要使用其它错误定位工具根据,仅依据RTP会晤层提供的数据包丢失信息,调用错误掩蔽工具来尽量消除误码对图像质量的影响。同时,通过RTCP的反馈机制,发送方可以很快得到丢包率信息,从而启动基于编码器的抗误码机制,如帧内自适应块刷新(AIR)策略等。

  4.第三代移动通信抗误码性能

  第三代移动通信是建立于直接序列扩频、软切换及快速功率控制等最新通信技术上的,因此具备抗窄带干扰,抗多径衰落及抗时延扩展等能力,同时第三代移动通信系统也采用了卷积码及TURBO码作为前向纠错编码(FEC),这样就大大提高了移动环境下数据传送的抗误码性能。而且由于直接序列扩频技术允许为移动终端用户分配多个语音或数据业务逻辑信道,这样就为在视频流媒体传送中采用一种叫做数据分割优先级传输技术提供了可能。压缩视频流中更重要的部分,如同步头或运动矢量信息可以单独占据一个优先级较高的逻辑信道,而相对次要的部分,如纹理信息可以只占用优先级较低的逻辑信道,这样可以确保在同样的传输环境条件下,视频质量受到误码的影响相对较小。

  四、总结

  本文介绍了适用于无线流媒体通信的视音频编解码标准及实时流媒体通信协议,并指出了在未来移动通信网络中提供流媒体服务时,将要面对的问题。由于建立于最新视音频编解码标准、实时流媒体通信协议及第三代移动通信技术之上的无线实时流媒体通信传输系统具有宽带、高压缩比、码率可扩展及抗误码等特性,人们可以乐观的预计:在未来移动通信网络中,各类高速实时多媒体业务的应用前景将会是十分广阔的。


----《中国多媒体视讯》
 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50