MPEG-4标准及其在广播电视领域的应用
发布时间:2006-10-14 4:15:41   收集提供:gaoqian
  MPEG(Moving Picture Experts Group)专家组继成功定义了MPEG—1和MPEG—2之后,于1993年7月开始制订全新的MPEG-4标准,并分别于1999年初和2000年初正式公布了版本1和版本2。到2001年10月,MPEG一4已定义了19个视像类(Visual Profile),其中新定义的简单演播室类(Simple Studio Profile)和核心演播室类(Core studio Profile)使MPEG-4对MPEG-2类别保留了一些形式上的兼容,其码率可高达2Gbps。随着MPEG-4标准的不断扩展,它不但能支持码率低于64kbps的多媒体通信,也能支持广播级的视频应用。MPEG-4标准将广泛运用于数字电视、动态图像、万维网(www)、实时多媒体监控、基于内容存储和检索的多媒体系统、互联网上的视频流与可视游戏、基于面部表情模拟的虚拟会议、DVD上的交互多媒体应用、基于计算机网络的可视化合作实验室场景应用、演播电视等,它将推动电信、计算机、广播电视三大网络的最终融合,从而成为今后一段时间压缩标准的主流。

  MPEG-4 标准的主要特点和功能

  MPEG—4视频编码标准支持MPEG—1、MPEC-2中的大多数功能,提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码,同时也支持基于内容的图像编码。下图为MPEG一4支持的码率与相应功能集之间关系的示意图。



在这一功能集的底层是VLBV(Very Low Bit Rate Video)核心。它为码率在5一64kbps范围内的视频操作与应用提供算法与工具,支持较低的空间分辨率(低于352 X 288像素)和较低的帧频(低于15Hz)。VLBV核心支持的专用功能包括:矩形图像序列的有效编码、多媒体数据库的搜索和随机存取。

  MPEG—4的HBV(High Bit Rate Video)同样支持上述功能,其码率范围在64kbps—10Mbbps之间,它与VLBL核心采用相同或相似的算法,但它支持更高的空间与时间分辨率,允许传输和存储适用于演播室的高质量视频信号,其输入可以是ITU-R Rec.601的标准信号,典型应用为数字电视广播与交互式检索。MPEG-4最终支持的码率将高于MPEG—2。   MPEG-4 提出了基于内容(Content-based)的存取概念,使用户可与场景进行交互。它对运动图像中的内容进行编码,其具体的编码对象就是图像中的音频和视频,称为AV对象(AVO:Audio Video Object)。AV对象可以组成AV场景(AVOs:Audio Video Object in a scene)。因此,MPEG—4标准的基本内容就是高效率地编码、组织、存储、传输AV对象。

  MPFG-4标准支持8项新的或改进的功能,可分为以下3类:

  1、基于内容的交互性

  基于内容的多媒体数据存取工具;基于内容的码流操纵和编辑;自然与合成数据的混合编码;增强的时间域随机存取。

  2、高压缩率

  提高编码效率;对多个并发数据流的编码。

  3、灵活多样的存取

  错误易发环境中的抗错性(Robustness);基于内容的尺度可变性(Content-based scalability)。

  MPEG-4标准的构成

  1、DMIF

  DMIF即多媒体传送整体框架,它主要解决交互网络中、广播环境下以及磁盘应用中多媒体应用的操作问题。通过DMIF,MPEG-4可以建立具有特殊品质服务(QoS:Quality of Service)的信道和面向每个基本流的带宽。

  2、数据平面

  MPEG-4中的数据平面可以分为两部分:传输关系部分和媒体关系部分。为了使基本流和AV对象在同一场景中出现,MPEG-4引用了对象描述(OD)和流图桌面(SMT)的概念。OD传输与特殊AV对象相关的基本流的信息流图。桌面把每一个流与一个CAT(Channel Association Tag)相连,CAT可实现该流的顺利传输。

  3、缓冲区管理和实时识别

  MPEG-4定义了一个系统解码模式(SDM),该解码模式描述了一种理想的处理比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效的管理,可以更好地利用有限的缓冲区空间。

  4、音频编码

  MPEG-4的优越之处在于,它不仅支持自然声音,而且支持合成声音。MPEG-4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。

  5、视频编码

  与音频编码类似,MPBG—4也支持对自然和合成的视觉对象的编码。合成的视觉对象包括2D、3D动画和人面部表情动画等。

  6、场景描述

  MPEG—4提供了一系列工具,用于组成场景中的一组对象。一些必要的合成信息就组成了场景描述。

  MPEG-4 标准的视频编码技术

  为了支持基于内容的交互性,即支持对内容独立地进行编、解码,MPEG一4视频检验模型引入了视频对象面(VOP:Video Object Plane)的概念。假设输入的视频序列的每一帧都被分割成多个任意形状的图像区域(视频对象面),每个区域可能覆盖场景中特定的感兴趣的图像或视频内容。输入进行编码的VOP可以是任意形状的,且形状和位置可随帧而变。属于场景中同一物理对象的连续VOP序列称为视频对象。同一视频对象的VOP序列的形状、运动和纹理信息被编码传输,或者编码为一个隔离的视频对象层(VOL:Video Object Layer)。

  MPEG-4视频编码器的基本结构包括形状编码(对于任意形状的VOS)、运动补偿和基于DCT的纹理编码(采用标准的 8 X 8 DCT或根据形状的自适应DCT)。具体的编码方法为:首先对输入的原图像序列进行场景分析和对象分割,以划分不同的VOP,得到各个VOP的形状和位置信息,它可以用alpha平面来表示。发送端只需传送alpha平面,接收端就可以确定VOP的形状和位置。alpha平面所需的比特数较多,需要进行压缩编码。显然,只要对VOP的轮廓进行编码和传送,接收端就可以恢复alpha平面,轮廓信息在轮廓编码器中进行编码。提取的形状和位置信息又用来控制VOP的运动和纹理编码。对运动和纹理信息编码仍然采用经典的类似MPEG-1/2标准的运动预测/补偿法。输入第N帧的VOP与帧存储器中存储的N—1帧的VOP进行比较,找到运动矢量,然后对两帧VOP的差值进行量化、编码。对不同对象的运动和纹理信息的编码可因地制宜地采用不同的方祛,以提高编码效率。编码后得到的纹理信息,与运动编码器和形状编码器输出的运动信息和形状信息复接形成该VOP的比特流层。不同视频对象的VOP序列分别进行编码,形成各自的比特流层,经复接后在信道上传送。传送的顺序依次为形状信息、运动信息和纹理信息。接收端的解码过程是编码过程的逆操作。

  MPEG-4 标准在广播电视领域应用前景

  随着MPEG一4标准的不断补充和完善,它已经能够支持广播级的视频应用。MPEG—4的出现将改变传统的电视制作理念,同时也赋予电视观众更大的自主权,它不但给广播电视领域注入新的活力,也将给广大电视工作者带来更多的机遇与挑战。MPEG—4标准在广播电视领域将会有以下应用:

  1、虚拟演播室

  MPEG—4独有的基于内容的交互性,可为虚拟演播室技术带来突破性的发展,虚拟演播室的应用范围也将得到扩展。

  ◇虚拟出席

  利用MPEG—4支持自然视频图像同合成数据混合编码的特点,可以实现虚拟出席。几个身处异地的表演者可以在虚拟场景中面对面地相互交谈,外地的节目嘉宾可以不必亲临本地演播室参与节目制作。

  ◇虚拟重放

  利用 MPEG-4支持对同一景物多视点编码的特点,可将其应用在立体视频方面,从而实现虚拟重放。虚拟重放主要应用于球类比赛的转播及评论节目等,可从各个角度模仿真实比赛的情况。

  ◇视频跟踪

  利用MPEG-4支持基于AV内容的数据访问和操作的特点,可有效实现视频跟踪。可在视频图像上直接描画各种箭头、轨迹、路线和标志,使观众更清楚地了解比赛中的每一个细节。

  ◇虚拟广告

  MPEG—4提供基于内容的码流操纵和编辑,使用户可以在图像中选择指定的对象并改变其特性,利用这一特点,可实现虚拟广告的制作。将演播室制作的虚拟广告牌插入到赛场或表演场的空地上,或用虚拟广告牌替换掉场地上原有的广告牌,合成后可达到以假乱真的效果。

  2、交互电视

  利用MPEG-4的交互性和支持多个并发数据流编码的特点,可实现交互电视的使用。例如:在同时转播几场足球比赛时,观众可在家里任意选择观看自己喜爱的比赛,他们甚至能以不同的分辨率同时选择观看3—4场比赛,还可享受附加的自动切换功能,以免漏掉所有比赛中的进球场面。这类应用还利用了MPEG—4所支持的复杂度可伸缩特性,即允许终端用户解码每个流时只利用接收端解码能力的一部分。当然,前提条件是节目本身可以按照不同的分辨率解码和显示。另外,用户还可被允许进行以下操作:改变场景的视、听点,例如在场景中漫游;把场景中的对象拖到不同的位置上;点击特定对象以触发一系列事件,例如开始或终止视频流;多语言音轨时选择想要的语言等。

  3、视频编辑

  MPEG—4定义的简单演播室类(Simple Studio Profile)能够为视频编辑提供高质量的信号,它仅有1帧,采用形状编码,支持多个alpha通道,码率可高达2Gbps。核心演播室类(Core Studio Profile)在简单演播室类的基础上增加了P帧,使编码更高效也更复杂。这两个新扩展的视像类使MPEG-4用于高质量的视频编辑成为可能。

  ◇利用MPEG—4支持基于内容编辑的特点,可直接选取音、视频内容进行编码,并对其灵活地进行控制和显示,用户可以自行选择场景中物体的解码质量,并可改变其某些特性,进行电视节目制作和编辑。

  ◇利用MPEG—4支持时间域随机存取的特点,能够对音、视频序列进行随机存取,并以序列中的某个音、视频对象为目标进行快速搜索。

  ◇利用MPEG—4支持自然与合成数据混合编码的特点,将各种特技功能应用在自然的和合成的AV对象上,增强了节目编辑制作能力。

  ◇利用MPEG-4的高压缩率和在误码环境中的抗错性,可以较窄的带宽传输新闻文稿及粗编节目,方便节目的审查、管理、制作和显示。

  目前,已经有公司展示了在拍摄的同时可将图像进行MPBG-4编码的数码摄像机,如果使用相应的网络组件,还可以通过因特网进行图像的实时发送。随着MPEG-4编、解码技术的成熟,未来由此产生的网上电视台将对传统媒体产生强烈的冲击.MPEG—4标准完成了从基于像素的传统编码向基于对象和内容的现代编码的转变,顺应了现代图像压缩编码的发展潮流,必将对未来的广播电视领域产生深远的影响。

摘自《中国CATV》
 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50