采用MPEG-4方式的VBI数据广播系统
发布时间:2006-10-14 4:15:14   收集提供:gaoqian
北京电视台高级工程师 卢英锁
  提 要:本文较详细地介绍了采用MPEG-4方式的VBI数据广播的原理及特点,同时阐述了VBI多媒体课件的制作和接收,以及VBI数据广播在中国教育电视台的应用及未来的发展方向。

  关键词:MPEG-4,VBI数据广播,图文电视,教育信息网

  目前MPEG-4数据压缩格式已经广泛应用于低码流的视音频传输和纪录系统中。中国教育电视台的VBI数据广播系统就是采用MPEG-4方式。MPEG-4对视、音频信号的处理范围很广,是一种能将巨大的数字包压缩成能在线传输的小型文件的音视频处理技术。该技术,很象目前一些通用的媒体格式,如MP3、Real Video和Windows Media。但更重要的是MPEG-4可以提供交互式功能。

  一、VBI数据广播系统

  VBI(Vertical Blanking Interval)是指利用电视画面的逆程消隐期间传送数字信号的技术。我们知道电视图像画面是通过电视的正程信号传输的,而VBI数据广播系统是将各类信息,以数字形式迭加在电视信号场消隐期的若干行上,与电视信号一起传输的广播系统。

  VBI数据行的基本结构见图1:

  第一场:7~22行(第6行之前的几行产生场同步信号,23行之后是图像信号),

  第二场:320~335行,



  图1 VBI数据行的基本结构

  原则上每场最多可使用16个行用于数据广播。一般只使用13个行,其它3个行做信道监测使用。VBI数据广播属于数字信号在模拟信号信道上搭载运行,这种形式不影响电视节目的正常播出,不专门占用频道资源,经济实用。VBI数据广播具有以下特点:

  1、VBI数据广播提供了一种信息传输信道,可以传输任意格式的计算机信息。中国教育电视台利用VBI数据广播信道播出多媒体格式的课件、压缩格式的气象信息、各类软件等。

  2、由于是将信息插在电视逆程中,随电视节目一起通过中国教育电视台卫星频道传送出去,只要能接收到较为清晰的电视节目,就能收看到该频道中的数据信号,因此,可以说VBI数据广播覆盖面很广,覆盖到全国任何一个地方。

  3、由于VBI数据广播属于搭载运行,是电视频道资源的深度开发,也就是在原有的模拟电视传送信道上又增加了一套独立的数字压缩方式传送多媒体信息的信道。这个信道不需要传送费用,而且接收方便,成本低廉。

  4、中国教育电视台VBI数据广播系统基于IP标准,容易实现广播电视技术与计算机技术的融合,只需将载有电视信号的电缆线接入VBI数据广播卡,即可以把大量课件下载到计算机或校园网服务器上,供学生使用。VBI数据广播的课件中包含多层界面,增加了教与学相关问答的信息,可实现人机交互。另外还可根据自己的需求,随时浏览、查询VBI数据广播提供的信息,满足广大地区的教学要求。对于边远贫困地区,它更是一种较为经济实用的学习手段。

  5、我国采用的是PAL D电视标准,如利用13个行进行传输VBI数据,每行插入320 bit数据信息,那么每个逆程VBI数据广播的传输速率为:13×320×25=104000?100Kbps。而目前电话线拨号上网通常的有效速率约为56Kbps,且电话线上网的速率还会随着上网人数的增加而降低;而VBI数据广播对每个人的接收速率都会恒定在100Kbps左右。利用VBI数据广播下载信息,每小时的有效数据量为20M字节,相当于1000万汉字的信息量。如果采用新的RS编码方式,VBI数据广播最高传输速率可达180Kbps,每小时能传送60M字节以上的信息,保证了信息的高速下载。

  VBI数据广播很灵活,可以同时播出多种格式的信息,而不必顾及信息的内容与形式。可以说,凡是以计算机文件形式存在的信息,都可以以VBI数据广播的形式播出。与Internet比较,VBI数据广播也有其不足之处,具体表现两个方面:

  1、单向性:这是由电视的单向性决定的。由于单向性,VBI数据广播不能实现网络交互,不能收发Email,不能进行电子商务等。

  2、信息面受限制:互联网上可以到世界的各个角落去访问各种各样的信息,而VBI数据广播的信息只能取互联网的一部分精华。但反过来理解,VBI数据广播的不足也是其优势所在:①、单向性保证了其传输速率不受上网人数的制约,每个用户都能以100Kbps的传输速率接收VBI数据广播信息和多媒体课件;②、单向性也保证了VBI数据广播信息内容的健康和权威,不会出现互联网上的信息垃圾和不健康内容。而且,如将VBI数据广播与Internet互联网或其它地面网结合,实现天地合一,VBI数据广播发挥的作用会更大。

  中国教育电视台VBI多媒体数据广播系统,基于MPEG-4格式,集多媒体课件的制作、接收和管理为一体,是现代远程教育的重要手段之一。学生对教育电视的要求与对新闻电视、娱乐电视的要求不同,随着信息技术的发展,教育电视将向以多媒体电视、多媒体计算机接收为主体的方向发展,使学生由被动接受电视教育变为主动操纵计算机的学习,使教学形式更加生动、直观和活泼。多媒体教学课件与传统的教学模式有较大的区别,传统模式的教学是以教师为核心,学生是以面授或在电视屏幕上观看教师讲课的方式来学习,形式枯燥,授课时间的固定,对于那些非面授的学生显得不够方便。将课堂教学的部分内容制作成多媒体教学课件,以光盘、互联网或VBI为载体发布,使教学灵活生动,便于学生反复观看,是非常好的辅助教学手段。

  二、MPEG-4标准

  MPEG-4标准将众多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供标准的算法及工具,用于实现音视频数据的有效编码和更为灵活地存取。MPEG-4提供更强的交互能力。场景中的每个对象独立编码,用户可以选择性地与其中某几个对象交互,具有良好的重用性。重新组合音视对象构造新场景,可以集成各种对象,无缝地集成各类信息。音频对象可以是单、双、多声道音频信息;视频对象可以是单、双、多镜头二维、三维视频信息。并且,通过各种网络传输的信息最终映射为本地信息,整个过程给用户的感觉就如同访问本地信息。MPEG-4具有基于内容(比特率、分辨率、帧率、防错保护和解码优先级)的可伸缩性和服务质量(QoS)参数可调性的特点,更加灵活,可扩展。

  MPEG-4引入了对象基表达的概念,用来表达音视对象;MPEG-4扩充了编码的数据类型,由自然数据对象扩展到计算机生成的合成数据对象,采用合成对象、自然对象混合编码SNHC(Synthetic/Natural Hybrid Coding)算法,在实现交互功能和重用对象中引入了组合、合成和编排等重要概念。MPEG-4中还制定了一个称为传输多媒体集成框架DMIF(Delivery Multimedia Integration Framework)的会话协议,用来管理多媒体数据流。该协议在原则上与文件传输协议FTP(File Transfer Protocol)类似,其差别是:FTP返回的是数据,而DMIF返回的是指向到何处获取数据流的指针。DMIF覆盖了三种主要技术:广播技术,交互网络技术和光盘技术。

  1、MPEG-4 标准的范围和特点

  ①、MPEG-4使得基于内容的产品成为现实,具有比目前的数字电视、动态图象、WWW网页技术及其扩展技术能够提供更大的灵活性;MPEG-4提供了透明的信息,能够在实体的帮助下解释并翻译成每个网络相应的本地信号信息,不仅可以预先考虑服务质量(QoS),还为不同的媒介提供一个通用的QoS描述符;另外,MPEG-4在所置的限制的范围内提供更高水平的内容交互,同时也为新兴网络,包括那些应用相对低速率的网络和移动网络提供多媒体服务。

  ②、对所有相关方面,MPEG-4力求避免大量的所有权、非交错格式和播放器的使用。为实现该目的,MPEG-4提供标准化方式的,代表语音、视觉本身及内容的单元,称为“媒体对象”。MPEG-4语音、视频场景由一些媒体对象组成,以分层方式组织起来。在该层次结构中,基本的媒体对象有静态图像、视频对象、语音对象等。MPEG-4把这样大量的能够表现二维或三维原始的和合成后的基本媒体对象标准化。编码形式的媒体对象是由在语音视频景象中处理该对象的描述元素和相关流数据组成。重要的是在编码形式下,每个媒体对象都能独立与它的环境或背景表现出来。

  基本媒体对象相对应于描述树中的叶子,而组合媒体对象包含了整个子树。例如:相应于正在说话的人的视频对象和相应的声音捆绑在一起形成一个新的组合媒体对象,包含了那个人的语音和视频部分。这样的组成,允许作者构建复杂的景象,使客户能处理有意义的对象。MPEG-4提供了一种描述景象的标准化方式,允许在给定坐标系内随处放置媒体对象,应用变换来改变媒体对象的几何和声学表现,将流数据应用于媒体对象,以更改属性,交互式地改变用户在景象中的任何视听点。

  ③、一个MPEG-4影音场景的媒体对象可能需要在一个或多个基本流中传输的流数据。对象描述符把媒体对象从所有相关的流中区分开来,这就允许处理分层编码数据、相关的内容变化信息和知识产权。每个流自身由一套配置信息的描述符加以区别,并且描述符可以携带传输需要的诸如最大位速率、位差错速率、优先级等QoS的线索。基本流的同步是通过流内单个访问单元的时标实现的。在不同QoS的网络中,从源到目的的流信息的同步传输,是由上述的同步层和包含两个子层的复合传输层确定的。第一个复用层根据MPEG-4标准的Part6中的DMIF规范进行管理。这种复用可在MPEG定义的FlexMux工具中体现,该工具允许以低复用费用组合基本流(ESS)。MPEG-4仅确定了该层的接口,而具体的数据包和控制信号规划的选择权留给了最终用户和服务提供商。

  ④、音频对象、视频对象(VO)的编码

  MPEG-4音频对象编码为表达自然声音和合成声音都提供工具。合成声音的表达可从文本数据或对结构的描述,以编码参数提供声音反射、空间定向的方式来实现。6Kbps~24Kbps速率的MPEG-4语音编码工具已和NADIB合作,通过了AM数字语音广播应用检验性测试实验,结果是数字技术可在同样带宽上实现更高质量。

  为了支持基于内容的交互性,即支持对内容(场景中的物理对象)独立地进行编解码,MPEG-4视频检验模型引入了视频对象面(VOP)的概念。假设输入的视频序列的每一帧都被分割成多个任意形状的图像区域(视频对象面),每个区域可能覆盖场景中特定的感兴趣的图像或视频内容。输入进行编码的VOP可以是任意形状的,且形状和位置可随帧而变。属于场景中同一物理对象的连续VOP序列称为视频对象(VO)。同一视频对象的VOP序列的形状、运动和纹理信息被编码传输,或者编码为一个隔离的视频对象层(VOL)。通过辨别各个视频对象层,接收端可以重建完整的原序列数据。有些多媒体业务需要提供面向读者的操作和编辑功能,如远程数据库访问、视频编辑等,另外有些场合,人们只对场景中的某个对象感兴趣,如多媒体会议,人们感兴趣的只是与会者的头肩像,而不关心背景。因此,为了节省带宽,可以只传送头肩像的视频信息,接收端再把收到的头肩像信息解码重建,并置于一间虚拟会议室中。基于内容的视频编码系统可以在比特流层支持这种基于对象的访问和操作。

  有两种类型的视频编码系统支持基于内容的交互性,一种是模型基编码,另一种是基于块的混合运动预测/补偿编码系统扩展到任意形状的视频序列编码。这种系统主要由场景分析、对象分割、形状编码、运动编码、纹理编码等模块构成,具体的编码算法则作为系统中实现各个模块功能的工具,可根据实际需求,选取、组合。对输入的原图像序列进行场景分析和对象分割,目的是划分出不同的VOP,以得到各个VOP的形状和位置信息。VOP的形状和位置信息可以用alpha平面来表示。发送端只需传送alpha平面,接收端就可以确定VOP的形状和位置。只要对VOP的轮廓进行编码和传送,接收端就可以恢复alpha平面,轮廓信息在轮廓编码器中进行编码。提取出的形状和位置信息又用来控制VOP的运动和纹理编码。编码后得到的纹理信息,与运动编码器和形状编码器输出的运动信息和形状信息复接形成该VOP的比特流层。不同视频对象的VOP序列分别进行编码,形成各自的比特流层,经复接后,在信道上传送。传送的顺序依次为形状信息、运动信息和纹理信息。接收端的解码过程是编码过程的逆操作。基于内容的视频编码技术在远程监控、移动多媒体、信息娱乐、多媒体会议、交互购物、电影和电视的后期制作、虚拟现实等领域具有十分广阔的应用前景。

  ⑤、MPEG-4允许用户和影像交互的可能性,依赖于作者所允许的自由度。用户可能被允许进行的操作包括:1)改变景象的视/听点(如在景象中漫游);2)把景象中的对象拖到不同的位置;3)点击特定对象,以触发一系列事件(如开始或终止视频流);4)当多语言音轨时,选择想要的语言等。(待续)


摘自 中国CATV
 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50