IP电话语音质量的测试

崔建平

  摘 要:从语音质量这一根本性的指标分析入手,对IP电话网络中影响语音质量的主要因素作定量分析并介绍其测量方法,以便对全面评估IP电话网络的性能提供参考数据。

  关键词:IP电话 语音质量 分析 测试

  1 IP电话网络语音质量的特殊问题

  与普通电话网比较,IP电话网采用了语音压缩编码算法,将话音用数据包的形式在分组交换网上传递,因此其对传输线路的时空利用率都有大幅度的提高。但IP电话也遇到了传统电话不太关注的语音质量问题。事实上,目前IP电话的用户都会感觉到通话过程中随时会出现令人难以忍受的语音畸变和频繁的断话现象。引起语音质量恶化的原因主要是IP电话网延时、丢包(包括数据包丢失和数据包排序溢出)、沿切割和抖动,其中延时问题尤为明显。

  IP电话网中,网关或路由器内部的语音编码器(Vocoders)对带内音频信号进行打包和重组。这些器件对确认接收和有效数据包接收的顺序进行纠错检查,一旦发现错误,将命令重发,而重发相关数据包则不可避免地造成传输上的延时。网关或路由器上的另一个重要组成部分——缓存器(Buffer)即为容纳这些延时的数据包而设置。一般地讲,缓存器的容量越大,数据包被损坏的机率就越小,但同时延时却会增大。这是一对矛盾,需要系统设计和管理者来综合平衡,选择最佳的配置。图1示出了IP电话网络中延时的分布情况。

  非常明显,在IP电话网中影响语音质量的因素是由其结构决定的特殊问题,而且各因素之间存在着此消彼长的制约关系。因此,根据电信网络服务质量(QoS)的要求,建立一套客观评估标准,并对IP电话网的语音服务质量进行定量分析和测量就摆在了从事这项工作的人们面前。

  为了便于下文进行的关于测试方案的介绍,现就IP电话有关的术语解释如下。

  (1) 回音抑制(Echo Cancellation Algorithm)

  其定义由ITU-T建议G.168给出。回音抑制的功能是用相位补偿的方法抵消串入远端发送信号中的远端接收信号。其目标是消除延时超过45ms的回声,因为当回音超过45ms时,发话方就能够听到反射回来、滞后的自己的声音。

  (2) 语音活动检测器(VAD,Voice Activation Detector)

  该器件在信号电平低于某一特定的门限值时,将限制数据包的传输,此时其提供空闲(idle)或者“舒适噪音”(Comfort noise)以避免电话用户感到“断线”(dead air),VAD是当线路状态从空闲变成传递信号时产生“前沿切割”(“Leading edge clipping”)和当线路状态从传递信号变成空闲时产生“后沿拖尾”(“trailing edge clipping”)的根源。

  (3) 语音编码器(Voice Coder - decoder,Vocder)

  该器件应用一种对人类语音有特殊功效的压缩算法,将模拟语音转换成数字比特流。语音编码器工作时仅需<64kb/s的带宽。这种算法不仅适用于语音的压缩,在增加专门应用软件条件下,它亦可支持调制解调器和传真的应用。语音编码器是在IP电话网中上产生延时的一个重要因素。

  (4) 语音压缩算法(Voice Compression Algorithm)

  人类语音交流过程中,通常有50%的时间为静音(Silent)。为了节约带宽,就必须压缩静音。同时还要使用不同的算法来对普通电话呼叫中的人类语音及其中所含的诸如DTMF等特殊的控制音调转换的指令进行压缩打包,并将其送达接收端。

  (5) 缓存器(Buffer)

  缓存器用于管理信息,使其按顺序从点到点依次通过。在诸如网关这样的器件中,缓存器的功能是处理两个方向的信息流。即语音编码器与分组交换网之间的发送信息流和分组交换网与语音编码器之间的接收信息流。缓存器通常按需要来设置其容量,而缓存器的溢出和冗余均是导致丢包、延时和抖动的重要因素。

  2 IP电话语音质量的测试

  2.1 测试参数

  IP电话网中的语音质量问题是普通电话网中不存在的特殊问题,能否对其进行定量的分析测量,并依据测量结果对IP电话网中各器件进行调整,使其达到最佳的语音质量,已成为决定IP电话生存发展的必要条件。 衡量语音质量有4个重要参数,即:

  · 延时(Delays),包括单向延时(One Way delays)和回路延时(Round - trip delays);

  · 丢包(Dropped - out);

  · 抖动(Jitter);

  · 沿切割(Clipping)。

  根据测试经验和理论分析,若使IP电话的语音质量接近普通电话,单向延时的指标最好<100ms,最大不能超过250ms(见图1),而丢包率不能超过5%。

  2.2 原有的测试方法

  随着IP电话技术的发展,人们不断寻求测试方法,以便能规范IP电话设备的技术标准。最初ITU-T建议P.800提出了MOS(Mean Objection Score)的方法。即请40 ~ 60 位有代表性的人士来听一段相同的语音样本,然后对该样本经过IP电话传输后的语音质量进行投票评价。随着语音因语言、年龄、性别的变化,得分亦被赋予不同的意义。这是一种纯粹主观的定性测量。ITU-T选取在非常宽的听觉范围内,不同年龄、性别和语言组别的相同得分,作出语音质量的判别标准:5:最佳 4:好(4.5 - 4.0 =可收费电信级) 3:中级(4.0 - 3.5 =可通话通信级) 2:较差(3.5 - 2.5 =可建立连接级) 1:差 很显然,MOS方法是一种模糊的评估方法,其测试结果很难对IP电话系统的改进和不同IP电话设备之间性能的比较作出有实际意义的判别。因此ITU-T在建议P.861中又提出了PSQM(Perceptual Speech Quality Measurement)方法。

  PSQM仍以MOS的5个级别作为客观标准,所不同的是其对每一个级别都以百分比的方式作出了差/最差(%PoW,Percent Poor or Worse )和好/最好(%GoB,Percent Good or Better)的进一步描述。根据P.861提出的PSQM方法,IP电话的测试开始摆脱原始的人类主观评估,而开始使用计算机产生的波型文件(Wave File),通过比较其通过IP电话网传输前后的变化计算出PSQM中相对应的级别及好坏程度。

  PSQM无疑比MOS前进了一步,但其实质仍然是一种定性评估的方法,不能准确给出影响IP电话网语音质量的诸因素的量值,而且波形文件不能完全代表各种不同年龄、性别、语言的人类语音通过IP电话网时的真实情况,同时在具体测试中必须令波形文件信号返回方可进行比较,这样就无法测量网络端到端的单向延时,这些都是PSQM的局限和缺憾。

  显然IP电话技术的发展迫切需要一种能定量分析测量其影响语音质量的4个参数的方法和相应仪器设备。

  3 Ameritec的测试方案

  针对IP电话网的特点和对其语音质量测试的要求,Ameritec在长期从事电路交换语音测试和模拟语音传输损耗测试(TIMS)研究的理论上,开发了用于分组交换系统测试的专利技术——“ Golden Voice ”。

  “Golden Voice”是一个复合音调发生器,其产生的复合音调信号可以确保其作为测试音信号可靠地通过所有现在的语音编码器和译码器(如G.711,G.728,G.729,GSM,CDMA 等)。

  “Golden Voice”可以配置在Ameritec的任何型号的大话务量呼叫发生器上,因此利用Ameritec的大话务量呼叫发生器可以随时为用户提供各种物理接口用于IP电话测试,如模拟用户线、随路信令 (CAS)数字中继(E1/T1),No.7信令(CCS)数字中继(E1/T1)和ISDN(BRI/PRI)等。图2所示为测试的连接。

  根据图2所示,可以提供的IP电话测试功能及指标如下。

  (1) 丢包测量(Dropout Measurement)

  语音丢包检测器可以连续地测量每一个语音通道的音频能量,对检测出的由于打包或帧丢失引起的超过5ms的丢包进行计数,并可对不同长度的丢包进行统计。

  (2) 前后沿切割测量(Leading and Trailing Edge Clipping Measurement)

  检测网关中相应部件对从静音—讲话和从讲话—静音之间的过渡状态的响应。

  (3) 抖动测量(Jitter Measurement)

  检测瞬间的时序变化,±5ms分辨力。

  (4) 单向和回路延时测量(One-way and Round-trip delay Measurement)

  各音频通道独立检测,单向±5ms分辨力,回路±10ms分辨力。

  4 测试分析

  (1) 丢包测试

  图3为丢包测试的时序图, 图中的复合语音路由测试信号即为“Golden Voice”产生的一种伪随机语音信号。在测试中,用户可以自行设定分别为5,10,15,25,50或100ms的检测门限值。

  一旦呼叫建立后,被叫即将测试音信号送至主叫(该测试音将覆盖语音编码器的动态范围),而主叫将检测该信号通过IP电话后的状态变化。

  如图3中“a”处,虽然出现丢包现象,但由于其时间间隔小于设定门限20ms,故在测试中忽略不计。“b”处出现一个为20ms的丢包,则计数一次。“c”处出现总长200ms的丢包,则计数器按20ms门限值的整数倍统计为10次,依次类推。也就是说,在图3例中,我们检测出在这次呼叫中共出现了11次丢包。

  (2) 沿切割、抖动和丢包测试

  在分组交换网中,沿切割、抖动和丢包通常是相伴而出的。如前所述,其产生的根源都在语音编码器,因此该3项指标可以在一次测量中完成。图4示出了沿切割和抖动对信号的影响。用户可以在不少于12个测试信号周期内选择不同的脉冲占空比(如25%、50%、75%或100%)以补偿在“静音”时有可能产生的丢包。测试过程如下: 建立呼叫→被叫应答→被叫送测试信号到主叫→主叫调整脉冲电平→主叫与测试信号同步→一旦电平调整与同步完成,开始检测抖动、前沿切割、后沿切割及丢包。

  (3) 延时测量

  单向延时测量过程如下: 主叫发起呼叫→被叫应答→被叫送出长度为100ms的带有时标标记的测试音信号到主叫→主叫检测收到的信号,并对时标进行测量,分辨力±5ms→呼叫完成后,仪器中的DSP将测量数据输出到LGC存储。

  回路延时测量依此类推,分辨力变为±10ms。

  

摘自 中国宽带网


微信扫描分享本文到朋友圈
扫码关注5G通信官方公众号,免费领取以下5G精品资料

本周热点本月热点

 

  最热通信招聘

  最新招聘信息

最新技术文章

最新论坛贴子