IP电话的话音质量保证技术(夏泽华)
IP电话利用IP(互联网协议)在互联网上传送话音。IP技术是一种面问非连接
的分组交换技术。它的通信资源的利用率远远高于传统的电路交换网技术,通信费
用也低得多,其最成功的应用就是互联网。
互联网采用的是交互式的网络体系和开放式的网络结构,采用分组交换和路由
技术,能够实现各种网络的无缝连接,并有效地降低成本。因此,IP技术是实现语
音、图像、数据等业务的最佳方案。然问,最初为数据报业务而设计的IP只负责主
机之间的数据传输,不进行检错、纠错。因此,经常发生数据丢失现象。为保证数
据的可靠传输,入们将TCP用于IP数据报的传输,提高了接收端的检、纠错能力。当
检测到数据包丢失或错误时,要求发送端重新发送,这样不可避免地会引起传输延
时和占用网络带宽。因此,传统的IP网络在传输实时音频、视频方面的能力较差。
为了使IP网络不仅能传输非实时数据信息,也能传送实时多媒体信息,目前已
有了一些技术方案。ITU、IETF等已开始起草了一些IP实时通信的作准。如实时传输
协议/实时控制协议(RTP/RTCP)、资源预留协议(RSVP)等。这些技术方案具体
可划分如下:
(1)避免丢失(RTP/RTCP,RSVP);
(2)丢失重建(冗余万案);
(3)丢失缓和(交织,隐藏,自适应打包/隐藏)。
RTP/RTCP
RTP/RTCP付于用户数据报协议(UDP)层之上,负责多媒体数据的传送。RTP
/UDP没有TCP那么可靠,并且无法进行资源预留及实时业务的质量保证,需要RTCP
实时监碎数据传输和服务质量。由于UDP的传输时过小了TCP,故能与合、视频流很
好地匹配,同此,实际应用中,RTP/RTCP/UDP多用于音、视频媒体,而TCP主要
应用于数据和控制信令的传输。
RSVP
IETF开发的RSVP在现有IP网络上实现带血倾留,为实时青、视频业务保留带宽
并设置队列管理。它装在网络节点(终端、路由器、交换机)中,以确保端到瑞的
传输带宽。当终端需要在一条路径上预留带宽资源时,希望向目的地发出一条路径
信息,该信息向该路径.上的所有节点(主要是路由器)申请预留带宽资源,同时
此信息还包含有关数据流的信息,如平均速率、数据包长度等。当节点收到路径信
息后,通过分析信息中的数据流信息,确定保留所需带宽资源。如果节点可用资源
不足,则拒绝申请;否则设置队列管理,同时将路径信息发给下一个节点。因此,
RSVP可以根据不同的应用分配带宽,有效地减少传输时延,保证实时传输。
冗余法
冗余(Redundancy)机制是往发送当前包时携带更早些的包的信息。这里建议
使用两种方法:
(1)信源编码冗余,即重复发送相同的信号数次。
(2)信道编码儿余,采用正向纠错编码(FEC)的方法。
不过,这些方法并没有考虑语音信号的特性,相对地增加传输的数据量。但是,
对突发的包丢失这一方案是很有用的。
交织法
交织法(Interlcaving)是提高语音信号的可听度的一种简单方法,即在不同
的包中发送同一信号段,因此分散了丢失包的影响。有以下几种方案:
(1)单元交织法(UnitInterleaving):语音信号被划划分为大小为L/I(L
是包的大小,I是每个包中的单元数)的单元。然后每隔1个单元装人相同的包,直
到装满后发送。当某一个包被丢失时,除了单元大小的“时隙”的信号被丢失外,
其它“时隙”的信号仍存在,结果减少了可听度的失真。
(2)样本交织法(SampleInterleaving):将波形编码器的连续样本分放在
两个个不同的包中。这样当一个包丢失时,至少收到另一个,并且丢失的样本可用
插值法恢复。不过,这一方案仅与波形编码器一起工作,且丢失一个包时对长度为
2L的语音段的影响较大。
交织法在接收端须新排序,因此交织法需较长的反应时间。
隐藏法
语音信号可粗略地划分为有声段和尤声段。有声段的信号呈现很强的周期性。
当打包时,相邻包的内容很相似。隐藏法(Concealment)就是利用这一特性来处
理当前包丢失时近似地填充这一间隙。
通常,隐藏法在转换器上没有引入附加机制,帮很适合于异质多波环境。这意
味着发送端可以使用不同的音频工具,接收端可根据特定的质量要求减少丢失,但
只适用于孤立的小媒体包(信号呈准周期特性,只有当语音信号段小于40ms时)的
丢失。要得到高质量的语音输出,在该时隙之后还须有大量的成功接收的数据包,
因此导致输出时延。若固定打包存在间隔,则某些部分信号由于无法覆盖丢失的整
个音素而不能隐藏。
自适应打包/隐藏
自适应打包(Adaptive Packetization)是发送端的算法将来自音频输入设备
的PCM样本送到样本缓冲器中,在自相关函数的最大值的位置返回。输入缓冲器指
针控制样本移动,在返回时形成一个块。若在信号中找不到周期性,则信号的内容
是非语音或杂音。因此,这样可检测到语音转换。为了防止发送IP所禁止的报头,
将两个连续的块装入一个包。当检测到有声音/无声音时,将该转换块一分为二,
如果包中只含前面的半愉,则将该块作为一个包发送。当无声音/有声音转换时,
则测试当前块与前一个块的后向相关。若此时已经包含了声音数据(由于前向处相
关计算),则将前一个块一分为二,对这一问题的解决方法是保留两个无声音的块,
并检查第三个块是否发生了无声音/有声音转换。用上述算法,“较重要”有声语
音在较小的包中发送,因此即使没有隐藏,所导致的丢失影响要比用固定包尺寸时
的影响要小。为了能在接收端隐藏丢失,还必须在包内传送附加信息——包内两个
块之间的界限。
当接收端检测一个丢失包时,由于在发送端预处理过了,接收端可假定丢失包
的块与邻近的块相似,避免隐藏信号的不连续性,邻近的块被复制并被再抽样以准
确地符合丢失块的长度。其块长度由包长度和包内块边界给定。因为丢失包的大小
和邻近的块可能只略有不同。所以,觉察不到明显的影响。
本文介绍了IP电话的质量保证技术。有些是ITU或IETF已制定的协议;有些则
是正在研究的方案。其中自适应打包/隐藏技术经实验证明对单个包丢失的恢复是
相当有效的,它能够恢复丢失50%的话音。在目前的互联网环境里,这一方案无疑
将成为最佳方案。
|