IP电话的话音质量保证技术
发布时间:2006-10-14 7:35:34   收集提供:gaoqian
IP电话的话音质量保证技术(夏泽华) IP电话利用IP(互联网协议)在互联网上传送话音。IP技术是一种面问非连接 的分组交换技术。它的通信资源的利用率远远高于传统的电路交换网技术,通信费 用也低得多,其最成功的应用就是互联网。 互联网采用的是交互式的网络体系和开放式的网络结构,采用分组交换和路由 技术,能够实现各种网络的无缝连接,并有效地降低成本。因此,IP技术是实现语 音、图像、数据等业务的最佳方案。然问,最初为数据报业务而设计的IP只负责主 机之间的数据传输,不进行检错、纠错。因此,经常发生数据丢失现象。为保证数 据的可靠传输,入们将TCP用于IP数据报的传输,提高了接收端的检、纠错能力。当 检测到数据包丢失或错误时,要求发送端重新发送,这样不可避免地会引起传输延 时和占用网络带宽。因此,传统的IP网络在传输实时音频、视频方面的能力较差。 为了使IP网络不仅能传输非实时数据信息,也能传送实时多媒体信息,目前已 有了一些技术方案。ITU、IETF等已开始起草了一些IP实时通信的作准。如实时传输 协议/实时控制协议(RTP/RTCP)、资源预留协议(RSVP)等。这些技术方案具体 可划分如下: (1)避免丢失(RTP/RTCP,RSVP); (2)丢失重建(冗余万案); (3)丢失缓和(交织,隐藏,自适应打包/隐藏)。 RTP/RTCP RTP/RTCP付于用户数据报协议(UDP)层之上,负责多媒体数据的传送。RTP /UDP没有TCP那么可靠,并且无法进行资源预留及实时业务的质量保证,需要RTCP 实时监碎数据传输和服务质量。由于UDP的传输时过小了TCP,故能与合、视频流很 好地匹配,同此,实际应用中,RTP/RTCP/UDP多用于音、视频媒体,而TCP主要 应用于数据和控制信令的传输。 RSVP IETF开发的RSVP在现有IP网络上实现带血倾留,为实时青、视频业务保留带宽 并设置队列管理。它装在网络节点(终端、路由器、交换机)中,以确保端到瑞的 传输带宽。当终端需要在一条路径上预留带宽资源时,希望向目的地发出一条路径 信息,该信息向该路径.上的所有节点(主要是路由器)申请预留带宽资源,同时 此信息还包含有关数据流的信息,如平均速率、数据包长度等。当节点收到路径信 息后,通过分析信息中的数据流信息,确定保留所需带宽资源。如果节点可用资源 不足,则拒绝申请;否则设置队列管理,同时将路径信息发给下一个节点。因此, RSVP可以根据不同的应用分配带宽,有效地减少传输时延,保证实时传输。 冗余法 冗余(Redundancy)机制是往发送当前包时携带更早些的包的信息。这里建议 使用两种方法: (1)信源编码冗余,即重复发送相同的信号数次。 (2)信道编码儿余,采用正向纠错编码(FEC)的方法。 不过,这些方法并没有考虑语音信号的特性,相对地增加传输的数据量。但是, 对突发的包丢失这一方案是很有用的。 交织法 交织法(Interlcaving)是提高语音信号的可听度的一种简单方法,即在不同 的包中发送同一信号段,因此分散了丢失包的影响。有以下几种方案: (1)单元交织法(UnitInterleaving):语音信号被划划分为大小为L/I(L 是包的大小,I是每个包中的单元数)的单元。然后每隔1个单元装人相同的包,直 到装满后发送。当某一个包被丢失时,除了单元大小的“时隙”的信号被丢失外, 其它“时隙”的信号仍存在,结果减少了可听度的失真。 (2)样本交织法(SampleInterleaving):将波形编码器的连续样本分放在 两个个不同的包中。这样当一个包丢失时,至少收到另一个,并且丢失的样本可用 插值法恢复。不过,这一方案仅与波形编码器一起工作,且丢失一个包时对长度为 2L的语音段的影响较大。 交织法在接收端须新排序,因此交织法需较长的反应时间。 隐藏法 语音信号可粗略地划分为有声段和尤声段。有声段的信号呈现很强的周期性。 当打包时,相邻包的内容很相似。隐藏法(Concealment)就是利用这一特性来处 理当前包丢失时近似地填充这一间隙。 通常,隐藏法在转换器上没有引入附加机制,帮很适合于异质多波环境。这意 味着发送端可以使用不同的音频工具,接收端可根据特定的质量要求减少丢失,但 只适用于孤立的小媒体包(信号呈准周期特性,只有当语音信号段小于40ms时)的 丢失。要得到高质量的语音输出,在该时隙之后还须有大量的成功接收的数据包, 因此导致输出时延。若固定打包存在间隔,则某些部分信号由于无法覆盖丢失的整 个音素而不能隐藏。 自适应打包/隐藏 自适应打包(Adaptive Packetization)是发送端的算法将来自音频输入设备 的PCM样本送到样本缓冲器中,在自相关函数的最大值的位置返回。输入缓冲器指 针控制样本移动,在返回时形成一个块。若在信号中找不到周期性,则信号的内容 是非语音或杂音。因此,这样可检测到语音转换。为了防止发送IP所禁止的报头, 将两个连续的块装入一个包。当检测到有声音/无声音时,将该转换块一分为二, 如果包中只含前面的半愉,则将该块作为一个包发送。当无声音/有声音转换时, 则测试当前块与前一个块的后向相关。若此时已经包含了声音数据(由于前向处相 关计算),则将前一个块一分为二,对这一问题的解决方法是保留两个无声音的块, 并检查第三个块是否发生了无声音/有声音转换。用上述算法,“较重要”有声语 音在较小的包中发送,因此即使没有隐藏,所导致的丢失影响要比用固定包尺寸时 的影响要小。为了能在接收端隐藏丢失,还必须在包内传送附加信息——包内两个 块之间的界限。 当接收端检测一个丢失包时,由于在发送端预处理过了,接收端可假定丢失包 的块与邻近的块相似,避免隐藏信号的不连续性,邻近的块被复制并被再抽样以准 确地符合丢失块的长度。其块长度由包长度和包内块边界给定。因为丢失包的大小 和邻近的块可能只略有不同。所以,觉察不到明显的影响。 本文介绍了IP电话的质量保证技术。有些是ITU或IETF已制定的协议;有些则 是正在研究的方案。其中自适应打包/隐藏技术经实验证明对单个包丢失的恢复是 相当有效的,它能够恢复丢失50%的话音。在目前的互联网环境里,这一方案无疑 将成为最佳方案。
 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50