高宇 王建平 张若庚
摘 要 首先介绍了多媒体通信的基本概念和主要特征,着重探讨了多媒体通信的关键技术及其发展趋势。
关键词 多媒体 多媒体通信技术 多媒体数据库 多媒体通信网
1 引言
随着技术的迅速发展,图像、视频等多媒体数据已逐渐成为信息处理领域中主要的信息媒体形式。多媒体通信是信息高速公路建设中的一项关键技术,是多媒体、通信、计算机和网络等相互渗透和发展的产物,它将极大地提高人们的工作效率,改变人们的教育、娱乐等生活方式,是21世纪人们通信的基本方式。
2 多媒体通信的基本概念和特征
2.1 基本概念
媒体是信息表示和传输的载体,是一个重要的概念。ITU-T I .374建议将媒体划分为感觉媒体、表示媒体、显示媒体、存储媒体和传输媒体5类。
多媒体数据是指多种式样信息的载体,如文本、图形、图像、声音等数据。其特点主要有以下几点:
(1)多媒体数据种类繁多(大多是非结构化数据),不同来源的媒体,具有完全不同的形式和格式;
(2)多媒体数据量庞大;
(3)多媒体数据具有时间特性和版本概念,如在视频点播系统中必须考虑到媒体间以及媒体内部在时间上的同步关系。
由此可知多媒体数据与传统的数值和字符不同,因而其存储结构和存取方式也具有特殊性,描述它的数据结构和数据模型也是有差别的。在这种情况下就产生了一种全新的数据库系统——多媒体数据库系统。
多媒体数据库是能够有效实现多媒体数据的存储、读取、检索等功能的数据库系统。它的主要特点是:
(1)继承了传统数据库的一些优点,例如数据独立性、利用数据库查询语言进行高层次查询、开发控制、容错技术等;
(2)能对具有时空关系的数据进行同步和管理。
但是目前对于多媒体数据库的功能以及实现方法还没有达成共识,因而出现了多种形式的媒体数据库,并且实现方法也各不相同。从其总体发展上看,多媒体数据库的数据模型可分为关系数据模型、面向对象的数据模型和超媒体数据模型3类。
基于不同数据模型的多媒体数据库管理系统(DBMS)的功能也有很大差别,通常基于关系数据模型的多媒体DBMS可以实现多媒体数据的存取,对多媒体数据对象之间的语义关系、时态关系、空间关系不加处理,所以这部分工作就留给应用程序去完成了。面向对象的数据模型和超媒体数据类型可以支持多媒体数据对象之间的语义关系、时态关系、空间关系的处理,其抽象程度更高,但DBMS的实现也相对复杂。
在多媒体通信系统中另一个常出现的词汇是“超媒体”。在出版物中经常会出现表示注解意思的“注“字,由“注”你可以找到与之相关的一段文字或一篇文章。这种由“注”而链接到一段文字或一篇文章的链即称为超链拨,同理,超级链也可以将若干不同媒体链接起来,其集合便称为“超媒体”。
2.2 多媒体通信的特征
多媒体通信技术的发展打破了传统通信的单一媒体、单一电信业务的通信系统格局,反映了通信向高层次发展的一种趋势,是人们对未来社会工作和生活方式的向往。多媒体通信技术是一种综合技术,涉及多媒体技术、计算机技术、通信技术等多个领域。多媒体通信系统必须同时兼有集成性、交互性、同步性3个主要特征。
2.2.1 集成性
多媒体通信系统的集成性指的是能对内容数据信息、多媒体和超媒体信息、脚本信息和特定的应用信息等4类信息进行存储、传输、处则和显现的能力。
(1)内容数据信息
信息是以某一种结构的形式存在的,典型的结构有两种:一种是对象结构,其中可处理的最小单元为对象(Object);另一种是文件结构,其中可处理的最小单元为文件(File)。
(2)多媒体和超媒体信息
多媒体和超媒体信息与单媒体信息不一样,它们是结构化的信息,由结构框架和内容数据2部分组成。多媒体和超媒体信息的最小表达形式由两类,一类称为对象,另一类称为文件。
(3)脚本信息
脚本信息是一组特定的用语意关系联系起来的、结构化的多媒体和超媒体信息,需要提供表示这一组多媒体信息的运作过程和与外部处理模块间的关系。
(4)特定的应用信息
上述3类信息都是低层信息,可以由标准来定义和表示。特定的应用信息是高层信息,是与应用密切相关的,将随应用场合的不同有很大的不同,它的表示方法是基于上述3类的基础之上的。
2.2.2 交互性
交互性指的是在通信系统中人与系统之间的相互控制能力。在多媒体通信系统中,交互性有两个方面的内容。一是人机接口,也就是人在使用系统的终端时用户终端向用户提供的操作界面;二是用户终端与系统之间的应用层通信协议。
多媒体通信终端的用户对通信的全过程有完备的交互控制能力,这是多媒体通信系统的一个主要特征,也是区别多媒体通信系统与非多媒体通信系统的一个主要准则。
2.2.3 同步性
同步性指的是在多媒体通信终端上显现的图像、声音和文字均以同步方式工作。如用户要检索一个重要的历史事件的片断,该事件的活动图像或静止图像存放在图像数据库中,其文字叙述和语言说明则是放在其他数据库中。多媒体通信终端通过不同传输途径将所需要的信息从不同的数据库中提取出来,并将这些图像、声音、文字同步起来,构成一个整体的信息呈现在用户面前。
多媒体通信系统中的同步性是多媒体通信系统最主要的特征之一,信息的同步与否决定了系统是多媒体系统还是非多种媒体系统。同步可在链路层级、表示层级和应用层级3个层面上实现。
3 多媒体通信的关键技术
3.1 多媒体数据的压缩编码
多媒体系统中需要对多媒体数据进行捕获、存储、传输和播放等处理工作,数据压缩技术是多媒体通信技术的核心问题之一。先进的数据压缩技术尤其是视频压缩技术可实现较低的时延和高的压缩比,达到较好的图像质量,这正是多媒体视听业务能被广泛接受的得要因素之一。
国际标准化组织(ISO)、国际电工委员会(IEC)、国际电信联盟(ITU)制定了一系列的视频压缩编码标准,主要有:
(1)ISO 10918 (JPEG)是用于连续色调静止图像压缩编码的标准。
(2)H.261适用的速率范围是p×64kbit/s(p=1~30),即64~1920kbit/s,主要用于可视电话和会议电视系统。
(3)H.263是以H.261为基础改进而来,可以获得更高的压缩比和较高的图像质量。
(4)ISO 11172(MPEG1)主要用于CIF(公共中间格式)格式的图像分辨率和大约1.5Mbit/s的数码率,适用于VCD。
(5)ISO/IEC 13818(MPEG2)基于3-4Mbit/s或4Mbit/s以上速率的压缩存储视频,图像质量可达到高清晰度电视水平,主要适用于DVD、数字电视、视频点播和数字视频广播(DVB)系统。
(6)MPEG4比MPEG2的应用范围更广,其压缩方法不再是限定的某种算法,而是可以根据不同的应用进行系统裁剪,选用不同的算法。MPEG4中引入的最重要,也最引人注目的新概念是视频对象平面(VOP)。这一概念直接导致了基于内容的压缩,为提供更高的压缩比打下了基础,同时也将传统的基于帧的时空可分级性扩展到基于图像内容的时空可分级性。
(7)MPEG7是有关多媒体内容描述接口标准,适用于基于视频和音频内容的多媒体检索业务。
有关音频压缩编码的国际标准有:ITU-T的G.711、G.721、G.722、G.728、G.723标准以及MPEG1音频编码标准(ISO 11172-3)、MPEG2音频编码标准(ISO 13818-3)和AC3音频编码系统。
随着多媒体业务的不断发展,新的视频和音频压缩编码标准不断涌现,适用范围逐渐扩大,压缩效率大大提高,从而使多媒体通信逐渐应用到日常生活的各个领域。
3.2 多媒体数据的同步
在多媒体通信技术领域,同步技术十分重要。目前,多媒体技术可以处理视觉、听觉甚至触觉信息,但支持的媒体越多,计算机系统的相应处理子系统也越多,处理这些媒体之间的同步问题也就越复杂。
分布式多媒体系统中的同步要求主要可分为多媒体通信同步、多媒体表现同步及多媒体交互同步等。这些同步功能表现为多媒体同步体系结构中的不同层次的同步要求。多媒体通信的同步属于中层同步,即合成同步。它的作用就是将不同媒体的数据流按一定的时间关系进行合成,一些要求精度较高的连续同步就属于这一类。多媒体通信的同步要求是分布式处理系统同步的最基本要求,是其他同步功能的基础,它和其他同步要求相互影响、相互制约。
目前解决多媒体通信中同步信息的方法很多,这里介绍3种基本的方法。
(1)时间戳法
这种方法既可用于多媒体通信,也可用于多媒体数据的存取。在发送或存储时,设想将各个媒体都按时间顺序分成若干小段,放在同一时间轴上,每个单元都做一个时间记号,即时间戳。处于同一时标的各个媒体单元具有相同的时间戳。这样,各个媒体到达收端或取出时,具有相同时间戳的媒体单元同时进行表现,由此达到媒体之间同步的目的。
用时间戳同步法传输时,不用改变数据流,不需要附加同步信息,因此其应用范围非常广泛。其缺点是选择相对时标和确定时间戳的操作较为复杂,需要一定的比特开销用于同步。此外,在主媒体失步或丢失的情况下都会引起其他媒体的失步或丢失。
(2)同步标记法
发送时在媒体流中插入同步标记,接受时按收到的同步标记来对各个媒体流进行同步处理,这就是同步标记法的基本原理。同步标记法有两种实现方法,一种是同步标记用另外一个辅助信道来传输,另一种是插入同步标记法,即同步标记和媒体数据在同一个媒体流中传输。
辅助同步信道法的缺陷在于它需要另加同步信道,增加了同步比特开销,而且当数据来自多个信源时,每个媒体流都需要一条同步信道。
插入同步标记法和辅助同步信道法相比,它改变了数据流结构,不能用于设备的直接连结,不能支持复杂的表现同步,不适用于多媒体数据存取的应用,也不适用于媒体流水来自多个信源的情况。
(3)多路复用法
这种方法将多个媒体流的数据复用到一个数据流中,从而使它们在传输中自然保持媒体间的相互关系,以达到媒体间同步的目的。多路复用的同步方法,接受端无需重新同步,无需全网同步时钟和附加同步信道,故实现起来比较简单,同步比特的开销较少;不足之处在于它的灵活性较差,无法满足不同层次的同步要求。
3.3 多媒体数据库
在1983年第九届国际超大规模数据库会议上,D.Tsichritzis等人就提出了多媒体数据库的概念。近年来由于数据压缩、海量存储、宽带网络、高速计算机技术的发展,使得多媒体很快成为计算机和通信行业的热点,而数据库作为信息管理的有效手段也成了多媒体研究的重要方向之一。
与传统的数据库管理系统相比,多媒体数据库应该重点研究以下问题:
(1)加强合理语义模型技术,特别是视像和图像的语义模型。这些模型应该有足够的能力抽象化多媒体信息和捕捉其特性,并且充分地表现出其时空特性。
(2)设计有效的多媒体数据的索引和组织方法。
(3)建立适合于媒体同步和集成的数据模型。
(4)加大多媒体查询语言的研究。查询语言能够表达出模糊的复杂语义,表现时空关系,并实现基于内容的查询。
(5)对于物理存储管理要设计出有效的数据存放模式,以满足多媒体数据实时性的要求。
(6)分布式多媒体数据库的管理。在网络环境下要求系统提供站点透明存取,并支持实时数据传输。
3.4 多媒体通信网
通信网络是多媒体应用的传输环境,多媒体通信对信息的传输和交换都提出了新的更高的要求,网络的带宽、交换方式及通信协议都将直接影响能否提供多媒体通信业务与多媒体通信的质量。多媒体通信网络的要求主要体现在以下几方面:
(1)多媒体的多样化,能同时支持音频、视频和数据传输。
(2)交换节点的高吞吐量。
(3)有足够的可靠带宽。
(4)具有良好的传输性能,如同步、时延、误比特率等必须满足要求。
(5)具备呼叫连接控制、拥塞控制、服务质量控制和网络管理功能。
这5项是实现宽带多媒体通信必备的技术要求,即多媒体通信应该具有高带宽、实时性、高可靠性即时空约束能力强等特点。
表1给出了各类多媒体信息对网络传输能力的要求。
表1 各类多媒体信息对网络传输能力的要求
多媒体信息 |
最大时延(s) |
最大时延抖动(ms) |
平均吞吐率(Mbit/s) |
可接受的误比特率 |
可接受的误分组率 |
音频 |
0.25 |
10 |
0.064 |
<10-1 |
<10-1 |
视频 |
0.25 |
10 |
100 |
<10-2 |
<10-3 |
压缩的视频 |
0.25 |
1 |
2~20 |
<10-6 |
<10-9 |
数据文件 |
1.00 |
- |
2~100 |
0 |
0 |
实时数据 |
0.001~1 |
- |
<10 |
0 |
0 |
图形、静止图像 |
1.00 |
- |
2~10 |
<10-4 |
<10-9 |
4 发展展望
近几年,计算机网络通信技术发生了极为迅速的变化。中国网通的宽带数据传输网——全IP骨干网已经迅速地建立了起来,成为“中国高速互联网示范工程”。
从美国NGI、Internet2、中国高速互联网示范工程和近期数据通信网新技术的发展,可以看出数据通信网络的发展方向是:
(1)由于Internet采用了全世界最广泛应用和支持的TCP/IP协议,从而统一了上层通信协议,IP网络是现代信息高速公路的统一平台;
(2)面向连接的电路交换将向分组化、包交换无连接和全球寻址方向转变;
(3)吉位、特位路由器将逐渐取代ATM或在较长时间内互补共存;
(4)IP Over DWDM和IP Over Optical已经成为未来宽带统一网络不可逆转的趋势。
摘自 邮电设计技术
|