重庆邮电学院 陈 禹 郑建宏 李应良
陈 禹 男,现为重庆邮电学院通信与信息工程学院研究生,研究方向为第三代移动通信及其多媒体应用。
郑建宏 男,现为重庆邮电学院通信与信息工程学院教授。
李应良 男,现为重庆邮电学院光电工程学院研究生。
摘 要:MPEG-4具有修正传输过程中产生错误的特性,即具有容错性。本文简要介绍了相应的容错机制的特性和应用,并分析了包括重同步,可逆可变长编码(RVLC)等方法的性能。第三代移动通信中引入MPEG-4作为视频压缩的标准,利用其容错性大大提高了多媒体传输的质量。
关键词:MPEG-4 容错 3G 视频
一、引言
在第三代移动通信系统中,由于速率的提高,可以提供丰富多彩的多媒体业务,而MPEG-4作为一种高效的多媒体压缩标准,已经被众多厂商作为视频压缩标准用于第三代移动多媒体通信中。
在移动信道多用无线电波来传输,但无线电传播的环境非常恶劣。携带信息的电磁波的传播是扩散的,地理环境复杂多变,用户位置处于移动中,并且不可预测,上述因素都造成了无线电传播的损耗。多媒体信息经过压缩后对错误特别敏感,所以在3G无线通信中多媒体应用遇到了瓶颈。多媒体的信息在无线信道下传播时不可避免的出现错误,如果不加以处理,则在接收端多媒体的质量将严重下降而不可用。
采用FEC(前向纠错)技术能能够一定程度上纠正随机错误,但对于较长时段的突发错误效果不明显。另外FEC也增加了冗余信息,冗余比(冗余比特数与整个比特数的比值)比较大,才能保证恢复出恶劣环境下被污染的数据比特,整个比特流增大,降低了编码效率。特别的,当比特错误的数目超过FEC的恢复能力时,尤其是较短时间内的BER很大时,FEC意义不大。
所以有必要在编解码器中采用容错机制来弥补信道编码的不足。
在解码器出现下列情况 ,解码器将采用容错技术。
1.一个不标准的VLC码出现
2.语义逻辑错误
3.一个子块出现多于64的DC系数
4.同步头信息不连续
基本的容错方面的处理有重同步、数据恢复和错误隐藏。
重同步采用与ITU-T标准H.261和H.263类似的打包技术。一个VP(VIDEO PACKET)的码流首先是一个重同步头(resync-marker),然后是一个信息头。信息头里包括能重新开始解码所必须的信息。
RVLC(可逆可变长编码)采用一种可逆VLC码字。这种可逆VLC码字的正反两面的结果一样,如111、101、010。但是这样降低了编码效率。如果一个突发的错误是一部分数据被污染,两个同步点之间的数据都丢失,但是采用RVLC就可以恢复部分数据。
采用必要的数据恢复技术是解码器能挽救出重同步点之间的一些数据,比如编码器在对DCT和运动矢量信息编码时采用一些特殊的VLC表。特殊的VLC能够在前向后向两个方向上解码。如果比较前向和后向的数据,比特流中出现的错误就能更精确的定位,两个重同步点之间的数据就能补救。这就是可逆VLC,也是MPEG-4标准的一部分。
数据恢复后,数据出现的错误的影响能降低到最小程度。这需要错误隐藏来达到目的。一个简单的错误隐藏策略是用前一帧视频序列中相应的宏块的色度和亮度数据来代替出错帧的色度和亮度数据。还有更复杂的技术,采用估计的策略,以发现存在于一帧视频数,可以更能好估计丢失或者错误的数据。
错误隐藏其效果很大程度上决定于重同步的性能。如果重同步能定位错误,隐藏就能比较容易处理。对于低码率延时短的码流,在重同步后采用拷贝前面一帧提供一个可以接受的错误隐藏结果。有必要进一步提高错误定位能力。数据分快可以达到目的。对于I-VOP,VP内所有的MB的直流系数可以集中在一起用直流标志(DC MARKER)与交流系数分开传送。如果交流系数出现错误 ,可用DC覆盖整个MB。对于P-VOP,VP内所有的MB的运动矢量(MV)可以集中在一起用运动矢量标志(MV MARKER)残差图像的DCT系数分开传送。如果DCT系数出错,整个MB丢弃这些系数而用MV所指的参考图像代替。
二、重同步
如果VOP的start
code被错误污染并且帧同步头信息丢失,解码器可以用HEC信息重建同步解码器比较VOP头信息和HEC的VOP_time_increment参数,如果不同,可断定本VOP的头信息被污染,VOP_time_increment应该是源视频格式(NTSC,PAL等)的帧率的整数倍。
在基于块的视频压缩技术中,采用了运动补偿和DCT,此时可根据下列事件来检测错误:
1.运动矢量超出范围;
2.出现无效的VLC表入口;
3.DCT系数超过范围;
4.DCT系数的数目超过64。
当解码器识别到上述任何一种事件时,它将标识出现一个错误并跳转到错误处理过程,由于视频压缩算法的特性,解码器在检测到的比特流的错误位置与产生错误的位置并不一致,而有着潜在的一段距离。解码器一旦检测到错误,它将失去与编码器的同步。译码器采用重同步方案转入与编码器的锁定阶段。编码器在比特流中大约相等的间隔插入唯一的重同步字码,这些字相对于有效的视频流来说是唯一的,也就是说没有视频算法VLC表的有效组合能产生这些码字。检测到错误后解码器往前寻找,找到重同步码字,一旦找到,解码器就转入与编码器的重同步。解码器在某点检测到错误后,重新得到与编码器的同步,并分离两个重同步点之间的错误。因为VLC的广泛应用,即使在检测到错误并分离出两个重同步点之间的错误,但对于错误的精确位置却不能确定,这样两个重同步点之间所有相应宏块的数据都将被丢弃(如图1),这就导致有出错的数据重建的图像引起及其让人不舒服的感觉。
图1 失去同步时丢弃的数据
在无线信道中传输的压缩视频中,比特流中引入了错误。解码器在对受到污染的数据进行解码时失去与编码器的同步,这样就不能确定当前数据块属于那个图像。要是不采取任何措施,视频的质量将严重下降而根本不可用。编码器在比特流的不同的位置插入重同步标志。当解码器检测到一个错误时它能搜寻道重同步标志达到重同步。
在H.261和H.263中需要在每列宏块的开始插入重同步标志,而在MPEG-4中,并不限制在每列宏块的开始处插入。编码器能对图像分割成视频分组进行选择,每个分组是连续的宏块由整数倍组成。这些宏块可以跨越几列宏块也可包括宏块的部分列。MPEG-4建议每K个比特周期性的插入一个重同步标志。图像中的某部分出现极度异常时,这区域相应的宏块就会产生更多的比特。如果MPEG-4编码器每隔一段(比如512比特)插入一个重同步标志,在重同步标志之间的宏块间隔就是高度异常的区域,同时也是与极少出现异常的区域比较分明。所以只要出现突发错误,解码器就能在图像中出现高度异常区域的几个宏块中对错误定位。除了在每个视频分组的开头插入重同步标志,编码器还需要去除同一图像但不属于同一视频分组的数据之间的依赖性。这样保证即使当前图像有一个视频分组受到错误污染,而另外的分组仍然可以解码被使用。为了去除数据简单依赖性,编码器要在每个视频分组的开头插入两个比特域,即是:
1.视频分组中第一个宏块的块数目,MB no.代表当前图像中宏块的空间位置;
2.量化参数,QP,即对DCT系数进行量化的缺省量化参数。
三、RVLC(可逆可变长编码)
在失去与编码器的同步时,RVLC(可逆可变长编码)的引入可以不必丢弃重同步标志之间的所有数据。MPEG-4使用有效的RVLC表来对DCT系数进行编码。
图2 采用RVLC时丢弃的数据
如果检测到错误,进行两个方向上的解码并采用下列丢弃策略。采用RVLC时丢弃的数据如图2所示。
图3 采用RVLC的一种策略
L:一个视频分组DCT系数的总比特数;
N:一个视频分组宏块总数;
L1:前向解码能正确解出的总比特数;
L2:后向解码能正确解出的总比特数;
N1:前向解码能正确解出的总宏块数;
N2:后向解码能正确解出的总宏块数;
T:门限(MPEG-4的门限值为90);
fm(k):前向解码解到第k个比特时解出的宏块数;
bm(k):后向解码解到第k个比特时解出的宏块数;
如图3所示,DCT的系数用RVLC来编码,当出现错误时的处理,黑体部分即为要丢弃的部分,这样就大大减少了丢弃的数据量,使更多的数据能够被解码,从而提高图像的质量。图中的情况应满足L1+l2
四、在3G中的应用
由于MPEG-4良好的容错机制,使得视频流在信道中传输后解码的质量得到保证。图4即为在无线信道中传输的视频编解码框图。
一系列新的协议构成了移动多媒体的框架,WAP用来接入蜂窝电话信息,RTP为IP网络的实时传输协议,MP-4即MPEG-4,为压缩编码的标准,H.323以及3G-324M为视频会议的协议。图5以WCDMA为例,表示了多媒体在3G应用的协议层次。基于电路交换(circuit-switched:C.S.)和分组交换(packet-based:P.B.)都将被支持。而3G-324M可以直接用于电路交换,实时能在移动终端提供实时的高质量的会议视频。对于INTERNET浏览,基于分组交换的连接能满足需求。
图5 WCDMA多媒体应用协议层次
五、结论
MPEG-4作为一种非常优秀的多媒体压缩标准,在第三代移动通信中将被大量采用。由于其容错机制的完善,MPEG-4能够在恶劣的无线环境下传输,而在接收端得到完全可以接收的质量的视频。要实现多媒体通信的高质量高速度传输,媒体流必须能在复杂多变的无线信道传输并保证可以为不同需求的用户接受的质量。
----《中国多媒体视讯》
|