IP电话语音质量的测试

发布: 2010-12-24 01:50 | 作者: | 来源: | 字体: 小中大

崔建平

　　摘要:从语音质量这一根本性的指标分析入手，对IP电话网络中影响语音质量的主要因素作定量分析并介绍其测量方法，以便对全面评估IP电话网络的性能提供参考数据。

　　关键词:IP电话语音质量分析测试

　　1　ＩＰ电话网络语音质量的特殊问题

　　与普通电话网比较，ＩＰ电话网采用了语音压缩编码算法，将话音用数据包的形式在分组交换网上传递，因此其对传输线路的时空利用率都有大幅度的提高。但ＩＰ电话也遇到了传统电话不太关注的语音质量问题。事实上，目前ＩＰ电话的用户都会感觉到通话过程中随时会出现令人难以忍受的语音畸变和频繁的断话现象。引起语音质量恶化的原因主要是ＩＰ电话网延时、丢包（包括数据包丢失和数据包排序溢出）、沿切割和抖动，其中延时问题尤为明显。

　　ＩＰ电话网中，网关或路由器内部的语音编码器（Ｖｏｃｏｄｅｒｓ）对带内音频信号进行打包和重组。这些器件对确认接收和有效数据包接收的顺序进行纠错检查，一旦发现错误，将命令重发，而重发相关数据包则不可避免地造成传输上的延时。网关或路由器上的另一个重要组成部分——缓存器（Ｂｕｆｆｅｒ）即为容纳这些延时的数据包而设置。一般地讲，缓存器的容量越大，数据包被损坏的机率就越小，但同时延时却会增大。这是一对矛盾，需要系统设计和管理者来综合平衡，选择最佳的配置。图1示出了ＩＰ电话网络中延时的分布情况。

　　非常明显，在ＩＰ电话网中影响语音质量的因素是由其结构决定的特殊问题，而且各因素之间存在着此消彼长的制约关系。因此，根据电信网络服务质量（ＱｏＳ）的要求，建立一套客观评估标准，并对ＩＰ电话网的语音服务质量进行定量分析和测量就摆在了从事这项工作的人们面前。

　　为了便于下文进行的关于测试方案的介绍，现就ＩＰ电话有关的术语解释如下。

　　（1）回音抑制（ＥｃｈｏＣａｎｃｅｌｌａｔｉｏｎＡｌｇｏｒｉｔｈｍ）

　　其定义由ＩＴＵ－Ｔ建议Ｇ．168给出。回音抑制的功能是用相位补偿的方法抵消串入远端发送信号中的远端接收信号。其目标是消除延时超过45ｍｓ的回声，因为当回音超过45ｍｓ时，发话方就能够听到反射回来、滞后的自己的声音。

　　（2）语音活动检测器（ＶＡＤ，ＶｏｉｃｅＡｃｔｉｖａｔｉｏｎＤｅｔｅｃｔｏｒ）

　　该器件在信号电平低于某一特定的门限值时，将限制数据包的传输，此时其提供空闲（ｉｄｌｅ）或者“舒适噪音”（Ｃｏｍｆｏｒｔｎｏｉｓｅ）以避免电话用户感到“断线”（ｄｅａｄａｉｒ），ＶＡＤ是当线路状态从空闲变成传递信号时产生“前沿切割”（“Ｌｅａｄｉｎｇｅｄｇｅｃｌｉｐｐｉｎｇ”）和当线路状态从传递信号变成空闲时产生“后沿拖尾”（“ｔｒａｉｌｉｎｇｅｄｇｅｃｌｉｐｐｉｎｇ”）的根源。

　　（3）语音编码器（ＶｏｉｃｅＣｏｄｅｒ－ｄｅｃｏｄｅｒ，Ｖｏｃｄｅｒ）

　　该器件应用一种对人类语音有特殊功效的压缩算法，将模拟语音转换成数字比特流。语音编码器工作时仅需＜64ｋｂ／ｓ的带宽。这种算法不仅适用于语音的压缩，在增加专门应用软件条件下，它亦可支持调制解调器和传真的应用。语音编码器是在ＩＰ电话网中上产生延时的一个重要因素。

　　（4）语音压缩算法（ＶｏｉｃｅＣｏｍｐｒｅｓｓｉｏｎＡｌｇｏｒｉｔｈｍ）

　　人类语音交流过程中，通常有50％的时间为静音（Ｓｉｌｅｎｔ）。为了节约带宽，就必须压缩静音。同时还要使用不同的算法来对普通电话呼叫中的人类语音及其中所含的诸如ＤＴＭＦ等特殊的控制音调转换的指令进行压缩打包，并将其送达接收端。

　　（5）缓存器（Ｂｕｆｆｅｒ）

　　缓存器用于管理信息，使其按顺序从点到点依次通过。在诸如网关这样的器件中，缓存器的功能是处理两个方向的信息流。即语音编码器与分组交换网之间的发送信息流和分组交换网与语音编码器之间的接收信息流。缓存器通常按需要来设置其容量，而缓存器的溢出和冗余均是导致丢包、延时和抖动的重要因素。

　　2　ＩＰ电话语音质量的测试

　　2.1　测试参数

　　ＩＰ电话网中的语音质量问题是普通电话网中不存在的特殊问题，能否对其进行定量的分析测量，并依据测量结果对ＩＰ电话网中各器件进行调整，使其达到最佳的语音质量，已成为决定ＩＰ电话生存发展的必要条件。衡量语音质量有4个重要参数，即：

　　· 延时（Ｄｅｌａｙｓ），包括单向延时（ＯｎｅＷａｙｄｅｌａｙｓ）和回路延时（Ｒｏｕｎｄ－ｔｒｉｐｄｅｌａｙｓ）；

　　· 丢包（Ｄｒｏｐｐｅｄ－ｏｕｔ）；

　　· 抖动（Ｊｉｔｔｅｒ）；

　　· 沿切割（Ｃｌｉｐｐｉｎｇ）。

　　根据测试经验和理论分析，若使ＩＰ电话的语音质量接近普通电话，单向延时的指标最好＜100ｍｓ，最大不能超过250ｍｓ（见图1），而丢包率不能超过5％。

　　2.2　原有的测试方法

　　随着ＩＰ电话技术的发展，人们不断寻求测试方法，以便能规范ＩＰ电话设备的技术标准。最初ＩＴＵ－Ｔ建议Ｐ．800提出了ＭＯＳ（ＭｅａｎＯｂｊｅｃｔｉｏｎＳｃｏｒｅ）的方法。即请40 ～ 60 位有代表性的人士来听一段相同的语音样本，然后对该样本经过ＩＰ电话传输后的语音质量进行投票评价。随着语音因语言、年龄、性别的变化，得分亦被赋予不同的意义。这是一种纯粹主观的定性测量。ＩＴＵ－Ｔ选取在非常宽的听觉范围内，不同年龄、性别和语言组别的相同得分，作出语音质量的判别标准：5：最佳 4：好（4.5 － 4.0 ＝可收费电信级） 3：中级（4.0 － 3.5 ＝可通话通信级） 2：较差（3.5 － 2.5 ＝可建立连接级） 1：差很显然，ＭＯＳ方法是一种模糊的评估方法，其测试结果很难对ＩＰ电话系统的改进和不同ＩＰ电话设备之间性能的比较作出有实际意义的判别。因此ＩＴＵ－Ｔ在建议Ｐ．861中又提出了ＰＳＱＭ（ＰｅｒｃｅｐｔｕａｌＳｐｅｅｃｈＱｕａｌｉｔｙＭｅａｓｕｒｅｍｅｎｔ）方法。

　　ＰＳＱＭ仍以ＭＯＳ的5个级别作为客观标准，所不同的是其对每一个级别都以百分比的方式作出了差／最差（％ＰｏＷ，ＰｅｒｃｅｎｔＰｏｏｒｏｒＷｏｒｓｅ）和好／最好（％ＧｏＢ，ＰｅｒｃｅｎｔＧｏｏｄｏｒＢｅｔｔｅｒ）的进一步描述。根据Ｐ．861提出的ＰＳＱＭ方法，ＩＰ电话的测试开始摆脱原始的人类主观评估，而开始使用计算机产生的波型文件（ＷａｖｅＦｉｌｅ），通过比较其通过ＩＰ电话网传输前后的变化计算出ＰＳＱＭ中相对应的级别及好坏程度。

　　ＰＳＱＭ无疑比ＭＯＳ前进了一步，但其实质仍然是一种定性评估的方法，不能准确给出影响ＩＰ电话网语音质量的诸因素的量值，而且波形文件不能完全代表各种不同年龄、性别、语言的人类语音通过ＩＰ电话网时的真实情况，同时在具体测试中必须令波形文件信号返回方可进行比较，这样就无法测量网络端到端的单向延时，这些都是ＰＳＱＭ的局限和缺憾。

　　显然ＩＰ电话技术的发展迫切需要一种能定量分析测量其影响语音质量的4个参数的方法和相应仪器设备。

　　3　Ａｍｅｒｉｔｅｃ的测试方案

　　针对ＩＰ电话网的特点和对其语音质量测试的要求，Ａｍｅｒｉｔｅｃ在长期从事电路交换语音测试和模拟语音传输损耗测试（ＴＩＭＳ）研究的理论上，开发了用于分组交换系统测试的专利技术——“ ＧｏｌｄｅｎＶｏｉｃｅ ”。

　　“ＧｏｌｄｅｎＶｏｉｃｅ”是一个复合音调发生器，其产生的复合音调信号可以确保其作为测试音信号可靠地通过所有现在的语音编码器和译码器（如Ｇ．711，Ｇ．728，Ｇ．729，ＧＳＭ，ＣＤＭＡ等）。

　　“ＧｏｌｄｅｎＶｏｉｃｅ”可以配置在Ａｍｅｒｉｔｅｃ的任何型号的大话务量呼叫发生器上，因此利用Ａｍｅｒｉｔｅｃ的大话务量呼叫发生器可以随时为用户提供各种物理接口用于ＩＰ电话测试，如模拟用户线、随路信令（ＣＡＳ）数字中继（Ｅ1／Ｔ1），Ｎｏ．7信令（ＣＣＳ）数字中继（Ｅ1／Ｔ1）和ＩＳＤＮ（ＢＲＩ／ＰＲＩ）等。图2所示为测试的连接。

　　根据图2所示，可以提供的ＩＰ电话测试功能及指标如下。

　　（1）丢包测量（ＤｒｏｐｏｕｔＭｅａｓｕｒｅｍｅｎｔ）

　　语音丢包检测器可以连续地测量每一个语音通道的音频能量，对检测出的由于打包或帧丢失引起的超过5ｍｓ的丢包进行计数，并可对不同长度的丢包进行统计。

　　（2）前后沿切割测量（ＬｅａｄｉｎｇａｎｄＴｒａｉｌｉｎｇＥｄｇｅＣｌｉｐｐｉｎｇＭｅａｓｕｒｅｍｅｎｔ）

　　检测网关中相应部件对从静音—讲话和从讲话—静音之间的过渡状态的响应。

　　（3）抖动测量（ＪｉｔｔｅｒＭｅａｓｕｒｅｍｅｎｔ）

　　检测瞬间的时序变化，±5ｍｓ分辨力。

　　（4）单向和回路延时测量（Ｏｎｅ－ｗａｙａｎｄＲｏｕｎｄ－ｔｒｉｐｄｅｌａｙＭｅａｓｕｒｅｍｅｎｔ）

　　各音频通道独立检测，单向±5ｍｓ分辨力，回路±10ｍｓ分辨力。

　　4　测试分析

　　（1）丢包测试

　　图3为丢包测试的时序图，图中的复合语音路由测试信号即为“ＧｏｌｄｅｎＶｏｉｃｅ”产生的一种伪随机语音信号。在测试中，用户可以自行设定分别为5，10，15，25，50或100ｍｓ的检测门限值。

　　一旦呼叫建立后，被叫即将测试音信号送至主叫（该测试音将覆盖语音编码器的动态范围），而主叫将检测该信号通过ＩＰ电话后的状态变化。

　　如图3中“ａ”处，虽然出现丢包现象，但由于其时间间隔小于设定门限20ｍｓ，故在测试中忽略不计。“ｂ”处出现一个为20ｍｓ的丢包，则计数一次。“ｃ”处出现总长200ｍｓ的丢包，则计数器按20ｍｓ门限值的整数倍统计为10次，依次类推。也就是说，在图3例中，我们检测出在这次呼叫中共出现了11次丢包。

　　（2）沿切割、抖动和丢包测试

　　在分组交换网中，沿切割、抖动和丢包通常是相伴而出的。如前所述，其产生的根源都在语音编码器，因此该3项指标可以在一次测量中完成。图4示出了沿切割和抖动对信号的影响。用户可以在不少于12个测试信号周期内选择不同的脉冲占空比（如25％、50％、75％或100％）以补偿在“静音”时有可能产生的丢包。测试过程如下：建立呼叫→被叫应答→被叫送测试信号到主叫→主叫调整脉冲电平→主叫与测试信号同步→一旦电平调整与同步完成，开始检测抖动、前沿切割、后沿切割及丢包。