本文作者王军先生,电子科技大学通信与信息工程学院通信抗干扰技术重点实验室助教、硕士;吴军蹄女士,通信与信息工程学院教授。
在过去20年里,在用户需求的推动下,视频技术获得了突飞猛进的发展,从广播电视、家用录像系统的普及,逐步过渡到基于数字视频技术的应用。通常可以将数字视频应用分为实时应用和非实时应用,前者包括电视节目(现场直播)和基于Internet 的流视频(Steaming Video)的实时传输播放,后者包括各种本地存储视频的播放,如DVD。涉及数字视频通信的技术包括视频压缩/解压、各种网络传输协议,同时还包括视频服务器操作系统、应用层QoS、媒体同步机制等。在本文中我们将首先讨论视频压缩技术,然后讨论视频通信技术,包括数字电视和基于ATM和SDL技术与MPGE-2视频的传输,我们的重点将放在基于Internet的视频流应用。另外,伴随蜂窝移动通信技术的发展,蜂窝移动视频传输也逐渐成为可能,我们也将简单介绍这方面的发展。
一 数字视频压缩
SMPTE(运动图像和电视工程师协会)和IEEE开发和管理非压缩的数字视频标准。这些标准包括:PAL、NTSC和SECAM标准分辨率的电视广播用数字视频标准CCIR-601;传输CCIR-601的SMPTE 259M;传输HDTV的SMPTE 292M。为了利用廉价的低比特率链路进行数字视频信号传输,或者存储数字形式的现场视频,必须对原始数字视频信号进行高效的压缩编码。
1 数字视频通信对编码器的要求
由于应用领域的差别,对视频编码器有不同的要求,共同的基本要求是:算法复杂度要尽可能小、算法处理的时间尽可能短、性价比尽可能高。综合不同的应用,这些要求可以分为:
(1)为了获得可以接受的视觉质量,视频编码器对带宽的要求要尽可能的小;
(2)对实时视频流通信,必须提供有界的端到端时延,以便视频分组可以及时到达解码器解码和显示;
(3)对于Internet带宽动态变化和蜂窝移动通信信道特性随机变化的通信网络,分组丢失不可避免,视频编码器应当能够处理分组的丢失;
(4)有些装置要求较低的能量消耗,如蜂窝移动电话,这些装置上的解码器应当简单;
(5)有些应用要求提供VCR一样的功能,如暂停、快退等,视频编解码器应当提供这些功能。
2 视频编码器基本结构
目前有很多高效的压缩算法投入实际应用。这些标准大多采用了基于运动补偿结合变换的压缩方案。
输入的视频帧首先经过空间域预处理器(Temporal Pre-processor),它主要决定是否应当对该帧编码,检测场景分界(Scene Cuts),选择预测模型(单向或双向)等。运动估计引擎(Motion Estimation Engine)负责在由空时预测滤波器(Spatio-Temporal Prediction Filter)生成的场中进行RD约束的基于块的运动搜索。用作运动补偿的块的大小在不同的标准中定义不一,从4×4到16×16像素。同样,从简单的1/2像素精确的双线空域内插到复杂的空时滤波技术,预测滤波器的实现也变化很大。运动估计后的剩余部分进行能量压缩的正交变换。对于这类变换,大多数标准的视频编码器都采用了8×8的DCT核。变换后的系数经过量化并送入无损统计编码器。为了与解码器保持同步,编码器复制了部分解压环(Loop),即反量化、反变换、运动补偿引擎和自适应去块滤波器(Adaptive Deblocking Filter)。为了将输出的比特率控制在确定的范围内,采用速率控制算法选择量化步长,同时提供空域预处理器和运动补偿引擎的输入信息。
上述运动补偿混合编码器没有考虑编码速率的可伸缩性(Scalability),只能生成单速率的编码视频流,仅适用于在点对点的稳定信道上传输,而不能满足其他通信方式的需要,如组播(Multicast)和多接入的通信。为了扩展其应用范围,人们提出了很多特殊的可伸缩模式(Scalability Mode)。可伸缩的视频编码器将原始视频流划分成多个子流(Sbustream),其中一个压缩子流是基本子流(Base Substream),基本压缩子流可以独立解码以提供粗糙的视觉质量,或者是较小的图像尺寸和较低视频帧刷新率。其他压缩子流是增强子流,增强子流只能和基本子流一起解码,但可以提供更好的质量。所有完整的子流可以提供最高的视觉质量。为了灵活适应不同接入链路带宽和时延的要求,针对MPEG-4提出了一种新的可伸缩编码机制,称为FGS(Fine Granularity Scalability)。一个FGS编码器将原始视频序列压缩成两个子流,即基本层比特流和增强层比特流。一种FGS的变体是PFGS(Progressive FGS)。PFGS可能有多个增强层,从而具有更精细的比特率步长伸缩性和更好的误码弹性(Resilience)。
。
3 视频压缩标准
视频编码标准主要由ITU-T和ISO/IEC开发。前者已经发布了视频会议标准H.261、 H.262、 H.263,并且准备进行远期编码标准H.263L的开发,以期望获得更大的编码效率。ISO/IEC的标准系列是大家熟悉的MPEG家族。包括:
(1)MPEG-1(1988~1992),可以提供最高达1.5Mbps的数字视频,只支持逐行扫描;
(2)MPEG-2(1990~1994),支持的带宽范围从2Mbps到超过20Mbps,MPEG-2后向兼容MPEG-1,但增加了对隔行扫描的支持,并有更大的伸缩性和灵活性;
(3)MPEG-4(1994~1998),支持逐行扫描和隔行扫描,是基于视频对象的编码标准,通过对象识别提供了空间的可伸缩性;
(4)MPEG-7(1996~2000),是多媒体内容描述接口,与前述标准集中在音频/视频内容的编码和表示不同,它集中在对多媒体内容的描述。
除了上述通用标准外,还存在很多专用格式,比较流行的有:C-Cube的M-JPEG、Intel的IVI(tm)(Indeo Video Interactive)、Apple的QuickTime(tm)、Microsoft的 Media Player(tm)和RealNetworks的RealPlayer(tm)。
二 数字视频传输
根据承载网络的变化和视频服务的区别,可以将数字视频的传输分为四类:数字电视、宽带视频通信、Internet视频流通信、蜂窝移动视频通信。
虽然这四种通信体系下对视频通信的协议和服务有不同的要求,但对于实时应用下述几点是必须满足的:(1)传输必须限制在一定时限内完成;(2)必须对端到端的抖动建议限制;(3)必须有相应的同步机制;(4)在分组网络中应当有较高的优先级。
1 数字电视广播
欧洲走在了全球DVB开发最前面,将其采纳为数字电视DTV的标准;在美国,ATSC采用了HDTV;在亚太地区,日本采用了基于DVB和ATSC的ISDB-T,澳大利亚采用了DVB,韩国则采用了ATSC标准,我国也在制定数字电视的标准,并进行了现场试验。下面我们以欧洲的DTV标准为主分别介绍DTV系统规范和传输技术。
a.DTV系统规范
根据传输系统的不同,DTV系统分为三类:陆基系统 DTV-T、卫星系统 DTV-S、有线系统 DTV-C。这三类DTV系统虽然各有不同,但也有公共的特性,MPEG-2视频和音频编码系统是所有DTV系统的基础。系统采用MPEG-2将数据压缩并组装成分组,称为净荷。对净荷采用Reed-Solomon前向纠错编码,降低信号传输中引入的误码。
卫星系统采用单载波信号,采用外部编码的同时,内部加入了打孔卷积编码,从而又增加了一层误码纠错能力,根据带宽的变化和采用的特定设备,编码数据是可调整的,信号采用QPSK方式调制。
陆基系统联合使用码正交频分复用 COFDM或者QPSK或QAM进行射频调制,采用了和卫星系统相似的打孔卷积编码。
有线系统采用了QAM调制方案,不需要附加的内部编码来降低误码,系统优化采用64-QAM。
b. DTV系统传输结构
DTV系统广播和接收的基本结构由三个子系统构成:
(1)信源编码和压缩子系统,通过ADC接受模拟视频和音频信号并将其转换成数字比特流,然后通过MPEG-2进行压缩,并加入控制和辅助数据;
(2)服务复用和传递子系统,复用将视频和音频及辅助数据流联合构成长188字节的分组,并加上标记,分组构成单个数据流,采用MPEG-2传递系统语法控制这些复用任务;
(3)传输子系统,包括对复用数据流的信道编码和调制。
2 宽带视频通信
这里讨论的宽带视频通信主要是指基于宽带核心网络和宽带接入技术的MPEG-2视频通信。为了满足实时视频通信对带宽的需求,核心网络通常采用宽带光纤网络,可以是ATM或者基于MPLS的宽带IP与ATM的结合,最后一公里的宽带接入的方法有光纤到户、光纤到楼双绞线到户及ADSL,最近也提出了宽带无线接入技术。通常,来自多个链路的数据业务在数字用户线路接入复用器(DSLAM)汇总。DSLAM将ATM业务路由到家中的ADSL接收器单元,同时,滤掉低频段的旧电话业务POTS 。在MPEG-2视频的情形下,ATM边界设备减轻信元的时延抖动的能力至关重要。ATM必须应付数据传输的需要并提供管理每个视频流的功能,特别要满足按序提取视频分组的要求。为了补偿网络传输延时,ATM网络边界设备必须精心设计以处理MPEG交换和抖动管理。本地MPEG-2视频流通过数字视频广播异步串行接口传输。ATM边界设备将MPEG-2多节目传输流(MPTS)或单节目传输流(SPTS)拆解到节目层并最终到分组标记(PID)层。在PID层,不同的节目流可以重新排序并复用进另外的MPTS。在ATM边界接收端,另外的边界设备管理ATM信元流,并重构SPTS或MPTS。本地的服务分布网络负责在本地的UTP网络分发视频内容。功能强大的MPEG-2压缩算法结合智能的ATM边界设备允许最后接入利用DSL技术作为视频分发的接入机制。
3 Internet流视频通信
通过Internet的视频回放包括两种方式:非流(Non-Streaming)和流(Streaming)视频。非流视频下载整个视频文件,然后由客户端的回放软件播放,不需要平滑分组流的定时功能,时延也不是问题。流视频通信通常包括现场视频广播(Live Braodcasting)与点播(On-Demand) 流视频两种情形,需要视频实时传输。下面,我们主要考虑Internet流视频的两种传输模式。
a.现场视频分发(Distribution of Live Video)
现场视频源信息输入编码器。编码视频引擎负责捕获、数字化输入的模拟视频信息,经过压缩后将数据送入服务器。同时,服务器也可以接收来自SLTA(Simulated Live Transfer Agent)的信息,SLTA读取预先编码的视频文档将其送入服务器。服务器负责将来自编码器的压缩信息分发到所有相连分裂器(Splitter)和/或加入广播的客户(Clients)。分裂器和附加的服务器可以是专用传输网络的一部分,或者是嵌入网络的业务缓存。最简单的情形是服务器或分裂器利用单向数据流(联合双向RSTP会晤控制)将编码视频信息分别单播(Unicast)到每个客户。在这种情形下,服务器和每个客户间的连接参数在每次会晤一开始进行估计,并能在广播中进行对称监视。当网络中有允许组播(Multicast)的路由器时,服务器仅需要发送一路组播流,这一路视频流可以自动复制到网络中所有定购用户。组播最重要的限制是单向传输和信息非保证的传递。而且,服务器通常不知道有多少客户定购了广播和/或它们实际的链路统计。处理不同连接速率的一个可能的方法是针对不同的比特率同时联播(Simulcast)视频数据源几个独立编码流,让客户决定采用那个流。除了客户/服务器间的传输外,流媒体网络还必须在分裂器间分发编码视频信息。网络实现这种分发有几种方法。一种可能的方法是由源服务器启动分发,由其将信息分发给直接相连的分裂器,这种方法称为Push Splitting。相对应,分裂也可以由连接到本地分裂器的客户启动,这种方式称为Pull Splitting。当分裂器是多接入传送网路的一部分时,它可以和几个地理上分布的上层分裂器连接,这种方式称为Multiple-Access Splitting。
b.点播分发(On-Demand Distribution)
点播分发和前一种方式最主要的区别是于在编码器和服务器间没有直接连接,而是首先将压缩的视频片断(Clip)纪录在磁盘上,然后由服务器分发压缩的文件。这种方式也允许远程代理服务器利用本地存储器缓存访问最频繁的视频片断。点播内容的服务器和客户间的通信基本上与现场内容的单播流相同。主要的区别在于,对于点播,用户可以回退和快进播放视频内容,而这种功能对于现场广播是不可用的。与现场内容的Push和Pull-Splitting不同,服务器-代理传输仅能由客户启动。而且,当传输时,代理在本地存储器也许已经有关于请求视频片断的信息。采用适当的编码技术,这样的信息可以用来降低到代理的视频流速率。
c.Internet流视频传输的关键技术
(1)视频压缩,视频压缩主要考虑可伸缩的压缩技术。
(2)应用层的QoS控制技术,包括拥塞控制和误码控制。前者致力于降低时延和消除分组丢失;后者提高在有分组丢失的情况下的表示质量。
(3)连续媒体分发服务,基于IP网络,连续媒体分发服务能够获得QoS和流视频效率。
(4)流服务器,需要在时间限制下处理数据并支持诸如暂停、快进和快退的功能,而且,流服务器需要在同步的方式下检索媒体分量。
(5) 媒体同步机制,利用媒体同步机制,接收端的应用可以按与其最初的方式表示多种媒体流。
(6)流媒体协议,提供诸如寻址、传输和会晤控制,包括网络层协议(如IP),传输层协议(如UDP、TCP、RTP、RTCP)和会晤层协议(如RSTP)。
4 蜂窝移动视频通信
由于IMT-2000可以提供144kbps到2Mbps的高比特率数据服务,支持更好的质量和覆盖范围,更高的功率和带宽效率,因此,视频通信逐步成为移动用户的需求。这些应用包括视频会议、视频电话、视频流通信、网站浏览等。可以将蜂窝移动通信网作为接入网,接入DVB-T、Internet请求视频服务。在蜂窝移动通信的条件下,误码率和分组丢失率很高,由于移动性(如切换)可能导致的链路丢失,使得实时视频通信变得十分具有挑战性。这里主要考虑视频编码和接入方式两个方面的问题。
当前的视频编码方案基本上主要考虑带宽的限制,而对高误码率和分组丢失率的考虑不够。可能的解决办法是采用基于分层的可伸缩编码方案,根据人的视觉特性将编码视频流分割成几个误码保护等级不同的子流,主要保护最重要的子流。
在接入方式上,通过蜂窝网传输DVB TV节目需要经过转换,以适应蜂窝移动通信的信道要求。通常可以是服务提供商提供可供蜂窝移动通信条件下的视频格式(包括特殊的压缩和编码),作为Internet流视频由蜂窝网络提供给移动用户,这种方式与当前的GPRS上的WAP多媒体短消息业务类似。另外,可考虑开发新的标准使两种网络共存,这对终端和网络都是新的挑战。
三 结束语
数字视频通信应用领域广阔,从娱乐业(如DTV、Video-On-Demand)到商业应用(如视频电话、视频会议),以及现在蓬勃发展的各种远程医疗、远程教学和培训,越来越深入人们的日常生活。尤其是Internet的迅猛发展和新一代的移动通信网络的开发,使得传统的以电视广播的为主的视频服务发生了根本性的变化。在数字视频的通信发展中,有以下几点趋势是我们必须把握的。
(1)视频压缩编码技术的发展将以支持可伸缩的方式为主要方向,基于分层模式,在提供更高压缩比的情况下,提供更高的误码弹性,以适应各种通信网络的要求。变换编码方式也将更多的考虑对上述要求的支持,如采用基于小波(Wavelet)变换的标准。
(2)网络将考虑更智能、灵活地支持QoS,如何在异种网络提供QoS将是考虑的重点。同时,网络如何更好地支持视频组播业务也必须认真研究。
(3)将来的视频通信网络将会是以宽带IP为核心,提供多种接入方式的交互式网络。DTV网络和电信网络、Internet网络的融合,对多种无线接入(如IMT-2000 、LMDS、WLAN、Bluetooth)和宽带接入技术的支持将会是发展的方向和研究重点。(完)
摘自《广电在线》
|