林啸
摘要 本文较为系统地介绍了有关IP网性能参数和指标,并结合作者的实际工作体会,对目前国内互联网运维管理中还有待提高的性能考评方法作出初步探讨,以供相关部门参考。
关键词 业务质量(QoS) 网络性能(NP) SLA 性能参数指标
0 概述
从1987年,钱天白先生发出“越过长城,通向世界”的第一封电子邮件,向世界宣告中国互联网事业开端的一刻起,互联网便在中华大地飞速发展。至本世纪初,随着中国成功加入WTO和中国电信的改革,互联网正改变着人们的工作和生活方式,互联网已成为信息沟通的主要纽带之一。
随着用户数量呈几何级数地递增,中国互联网的网上业务流量发生了质的飞跃。网上业务量爆炸性增长使网络负荷越来越重,致使服务质量严重下降,影响了国内用户对互联网业务的正常使用。中国互联网络信息中心CNNIC的历次调查结果显示,上网速度太慢是用户对互联网最为失望的因素,到1999年初,有92%的上网用户对速度的限制表示遗憾,网络瓶颈限制了业务的正常开展。
对这一点,我国互联网运营商已有充分认识,1998年起中国国内互联网的骨干层带宽和国际出口带宽都进行了较大规模的扩容(1998年底国际出口带宽总合为143M,2003年底就达到了27G,增长了近200倍)。而且国内大规模宽带IP城域网的建设,也促进了用户上网速度的提升。
但由于中国国内互联网接入服务提供商纷繁复杂的网络状况、用户端瓶颈、相对薄弱的网络管理和控制等因素,用户仍无法享受足够满意的服务。根据CNNIC的调查,2003年,网速仍是影响互联网业务用户满意度的首要因素之一,有30%的用户对此表示了不同程度的遗憾。
图1 中国互联网国际出口带宽扩容情况(Mbps)
从对现有网络的调查中可发现,以传统电信网的观点分析现有互联网骨干网资源的占用情况,还是比较充足的,网络资源的利用率还存在上涨空间。
另外,IP网运营商为更有效地吸引大客户,往往与其签署业务等级协议(SLA),而签署SLA的关键前提就是要清楚地掌握自己网络的实际运行性能。因此,对现有互联网性能进行准确到位的分析,是目前国内外各家互联网运营商普遍关心的问题。
1 业务质量与网络性能
1.1 业务质量与网络性能的定义
要更为客观地评估IP网络性能,首先应明确两个目前在业界时常被混淆的概念:业务质量和网络性能。
——业务质量(QoS)
今天的电信业,QoS一词使用的频率非常高,但没有给出一个QoS准确的定义,或往往阐述得不够全面、准确,甚至在一些ITU-T文献或建议中也时常出现这种状况。
业务质量QoS全称Quality of Service,根据ISO9000的定义,“质量是指满足特定需求的一系列固有特性的程度”。
而在电信领域,ITU-T在E.800建议中明确定义QoS为“能够决定用户使用该种业务满意程度的业务性能的综合结果”。
——网络性能(NP)
所谓网络性能,从业务提供者的观点而言,是指一个网路可被定义、被测量及被控制以达到满意的业务质量的特征。
1.2 业务质量与网络性能的关系
从两者的定义可看出,业务质量和网络性能是两个角度的概念,业务质量从用户对业务的实际使用感受出发,描述业务的使用性能。而网络性能是从Operator角度制定的衡量网络实际运行状况的参数指标体系。
·网络性能反映网络元素的本质状况,而业务质量是网络运行状况的外在表象;
·网络性能可描述整个网络端到端的特性,也可描述特定网段的特性,而业务质量只是描述从业务接入点得到的用户感受;
·网络性能对业务质量有很大影响,互联网用户在使用互联网业务时所穿越的不同网络的网络性能组合及其在时间上的分布规律,在很大程度上决定了该业务的质量;
·可以通过测量具体的网络性能指标对网络进行评估,而业务质量除依靠指标进行衡量外,往往还依赖于用户的主观感受。
2 IP网性能参数
2.1 IP网常用性能参数
·IP包传输时延(IPTD)
定义为IP包穿过一个基本段或网络段集合所经历的时间,与该包传送成功与否无关。
——平均IP包传输时延(Mean IPTD):指一个数据流中所有IP包传送时延的算术平均值。
·IP包时延变化(IPDV)
两点间IP包时延变化有3种定义:
——原定义:端到端两点间IP包时延变化(vk)是IP包K通过源节点SRC(MP1)和目的节点DST(MP2)的实际时延(xk)与通过相同节点间定义的参考IP包传送时延(d1,2)的差,即:vk=xk-d1,2。
——替代定义1:在一段较短的测量时间间隔内,最大IPTD与最小IPTD的差值。
IPDV=IPTDmax-IPTDmin
——替代定义2:
IPDV=IPTDupper-IPTDmin
其中:
——IPTDupper是评估间隔内IPTD的1-10-3百分位值
——IPTDmin是评估间隔内IPTD的最小值
IP包时延变化参数非常重要。在数据包传送应用中,利用IP包时延变化范围的信息可以避免出现节点缓冲的溢出和读空;IP包时延变化会引起TCP层重传定时器门限的增高,也可能引起数据包重传的时延或造成没有必要的数据包重传。
·IP包误差率(IPER)
是错误IP包传送结果与成功IP包传送加错误IP包传送结果之和的比值。
·IP包丢失率(IPLR)
是丢失的IP包传送结果与所有IP包的比值。
·虚假IP包率(SPR)
一个出口节点的虚假IP包率指在一个特定时间间隔内在该节点上观测到的虚假IP包数量除以该时间间隔。
·IP网络的流量参数(Flow Related Parameters-FRP)
——IP包吞吐量(IPPT)
出口节点的IP包吞吐量等于一个特定时间间隔内在该节点上观测到的所有成功IP包数量除以该时间间隔。
——基于字节的IP包吞吐量(IPOT)
出口节点的基于字节IP包吞吐量等于一个特定时间间隔内在该节点上观测到的成功IP包中所有字节数量除以该时间间隔。
2.2 IP网性能指标
·QoS等级说明
一定范围的IP网性能参数组合构成一种QoS等级。用户的QoS等级与用户IP包的传送距离和网络的复杂度有关。根据不同业务和应用的需要,用户可以请求和得到不同QoS等级的服务。
IP业务的QoS等级按应用、节点机制和网络技术可划分为6大类。
不同的QoS等级,对于IP网NP参数的指标要求也各有差异。
·IP网的端到端性能参数目标参考值
以测量点为边界的端到端(不包含用户驻地网)IP网络性能指标见表2。实际用户享受到的服务性能一般会优于表2的规定。
注:1.表中规定的所有值都是临时的,今后将根据实际运营经验调整这些指标;
2.某些应用(如MPEG-2)要求IPLR < 5 x 10-5。
表2是ITU-T所定义的参考指标,而各个运营商往往是根据自己网络所开展的主要业务等因素,制定适合自己的网络性能指标,其指标往往高于以上指标的要求,因此用户能够得到更为优质的服务。
2.3 IP网性能指标与网络结构的关系
正如上文所述,IP网网络性能可以是端到端的指标,也可以是某个特定网段的指标。由于IP网络是由众多的区域性网络互联而成的,而这些网络可能是由不同的运营商进行维护和管理的,端到端的网络特性往往不能很好地加以控制和约束,因此需要相应的指标对这些网络分别进行评估。
目前国内互联网上的业务包括国际业务,国内网间业务和运营商网内业务。针对不同的应用,其端到端的网络性能指标会被分配到不同的网段上。网段包含单运营商网络、网间链路、接入链路。甚至在全国性运营商网内,也可按骨干网、省网、本地网等进行划分。
实际上,运营商不必严格按照ITU-T建议的网络模型分配端到端指标,重要的是对自己网上主要业务的跨网情况、流向特性作出正确判断。
另外,在计算具体参数指标时,必须考虑链路的物理距离,通常运营商可将实际长度适度放大,以提高网络的实际使用性能。放大幅度自己掌握,一般距离越短,倍数越大。
2.4 国外运营商IP网络性能指标
·性能参数
国外IP运营商建设经营IP网络较早,其运维经验较中国同行更丰富些,因此有许多可借鉴的地方。表3是国外IP网络运营商选取的网络性能参数及其测量的方法。
可见,不同的运营商由于其业务重点不同、用户群差异,所以心的网络性能的侧重面和细节也有所不同,致使它们采用不同的网络性能考评体系来评估网络的运行质量。
·SLA指标
在对于自己网络充分了解的基础上,各个运营商制定了与大客户的SLA指标,参见表4。从表4可看出,国外用户作为关心的网络指标是时延、丢包率和可用性,从另一个侧面也反映出互联网运营商所关注并能适时加以控制的指标也主要是这三项。
3 IP网网络性能考评
3.1 性能参数的选取
上面罗列的多种NP参数并非都是互联网运营商必须准确关注的。运营商网络性能参数的选取应考虑几方面的因素:
① 定义网络参数的真正出发点是通过观察和控制指标,满足用户对业务的需求,因此所选参数必须能和用户业务的QoS相联系,反映用户业务的使用效果和感受;
② 所选参数必须能通过一定的技术手段观测和控制,并且不能过于复杂,否则会加大维护工作的难度和工作量;
③ 所选参数应能够从整体上反映网络的实际运行效果,而不是仅反映某个特定阶段或特定网段的性能。
国内的互联网运营商可以从以下三个方面对IP网络的运行状况进行考评:网络的连接性、网络流量特性、网络可用性。
·网络连接性参数
在表述连接性网络性能参数中,非常关键的是时间透明性参数和语意透明性参数。
——时间透明性参数
最为可取的时间参数包括网络时延(单向时延和双向时延)参数和时延抖动参数。
这里的网络时延(区别与业务时延)是指IP包经过特定网段所经历的时长,而由于互联网业务选路的特性,决定了IP包往返所经过的实际路由往往有所不同,因此双向网络时延更能够反映交互性较强的业务使用效果,而单向时延对数据传送等单向互联网业务有一定的反映。
时延抖动对于某些特定的业务是比时延参数更为重要的指标,其定义见IPDV。
——语意透明性参数
网络的语意透明性在一定程度上反映了许多业务的可用性,因此考核网络性能一定要选取适当的语意透明性参数。最重要的语意透明性参数应为丢包率。
·网络流量参数
网络流量参数直接与网络建设、扩容、调整相关联,因此也是大多数电信互联网运营商长期用于网络运维的参数。
大多数互联网运营商往往基于其电信网的维护经验来选取参数,而忽略了互联网的特点,没有抓住IP业务的本质特征,造成了建设和维护上的失误。
下面推荐几种可采用的网络流量参数:
——流量流向参数
描述特定链路上峰值/平均业务流量情况,以矩阵形式表示全网的业务流量流向。
——流量特征参数
描述全网/网段/链路上业务流量的特征,可取的参数包括:峰值持续时长、峰值周期、峰平比。
——利用率参数
利用率是最为直接地指导网络扩容的参数,目前国内运营商常用的是平均忙时利用率,而用户则更注重忙时的业务质量。
因此对忙时利用率及其持续时长的监控是分析网络性能的非常关键的手段。
除此之外,可以定义平均利用率、利用率的峰平比等参数,这些参数也是非常有用的网络考核指标。
·网络可用性参数
IP网络业务可用性用于描述网段段和端到端的IP网络业务。把IP网络业务的全部持续时间分为可用时间和不可用时间。
——IP网络业务可用性功能
IP网络业务可用性功能的基础是IP包丢失率(IPLR)性能的门限值。如果一个端到端IP网络业务的IPLR低于下表中的门限值c1,则该端到端IP网络业务是可用的,否则是不可用的。
门限值c1仅被用来确定何时IP网络的资源不能支持特定的IP包传送业务,不能当作适合各种应用的IPLR性能指标。因此当运营商IP网络支持多种QoS时,适当的方法是用不同的c1值来对应不同的业务。
——IP网络业务可用性参数
IP网络业务可用性参数有两个,一个是IP业务不可用百分数(PIU),另一个是IP业务可用百分数(PIA)。并且:
PIU=100-PIA
-IP业务不可用百分数(PIU)
不能应用IP业务可用性功能的时间间隔占IP业务全部时间间隔的百分数。
-IP业务可用百分数(PLA)
能够应用IP业务可用性功能的时间间隔占IP业务全部时间间隔的百分数。
3.2 指标的确定
以上给出的ITU-T对网络性能参数指标,只是针对不同业务和应用提出的参考,而实际在网络上运行的业务多种多样,因此需要考虑的问题也更为复杂。用户考虑更多的是业务的可用性和使用效果,即对QoS更为关注,而网络运营商最关心网络总体运行状况,通过对网络指标的观察和控制,使用户获得更为满意的服务。因此,运营商网络性能指标的确定必须和业务的QoS建立一定程度的映射关系。这种映射关系的确立可通过以下三种方式进行。
·基于SLA的QoS
一些大用户在与IP网络运营商签订服务合同时会明确定义业务等级协议(SLA),对业务的时延、丢包率等特性提出明确的需求,其实质是提出了业务的QoS。对这种具有量化指标的QoS要求,运营商可以对应选取网络性能参数,确定网络的考核指标。
·基于特定应用的QoS
互联网上的部分特定业务或应用对网络性能有较高的求,虽然用户不会直接定义业务的QoS参量,但如果某些参数降低到一定程度就会影响该业务的开通效果。因此,对应特定的业务,运营商可选取相应的性能参数进行考察,并确定相应的考核指标。
·传统IP的QoS
目前互联网上大多数业务还是基于Best effort的传统IP业务,对于QoS并没有具体的要求。因此,对这类业务,运营商主要应关注自身网络的整体性能,根据总体需求选取参数,制定考核指标。
实际上,上述各种情况在现有网络上同时存在,因此IP网络运营商在制定网络考核指标时需兼顾各种情况,以满足绝大多数网上业务和应用的顺利开通和正常运行。
3.3 指标的测量与分析
除了需求合适的指标外,指标的采集方法、采集制度及分析体系也很重要。
·采集方法
目前IP网络性能参数的测量方式有两种:主动测量和被动测量。
主动方式是插入测试包测试网络。这在一定程度上增加了网络负担,当网络发生拥塞时易加重拥塞,网络流量过低时又易造成数据采集不准确,测试结果往往受测试包长度和类型的影响。故在实际测试时,应慎重选取测试时间和IP包类型、长度,或者考虑多种测试包同时采用。
被动方式采用MIB监测的方式采集性能参数指标,这种方式可得到更为准确有效的测试结果。需要注意的是,采集时应对数据进行分析,建议只统计设备端口的IP数据包,这样采集的数据将更为真实。但对一些跨网业务来说,这种测试往往不能实现。
表5显示了对以上性能参数指标建议采用的测试方法。
按照参数采集手段,参数的收集又可分为手工采集和自动采集。手工采集由网络管理员按照一定的工作流程和命令行收集网络性能的各项参数指标;自动采集则借助于专用工具(测试仪表、嵌入式程序等)对网络参数进行侦测。
·采集制度
指标采集最好能形成一定的制度,明确测量周期,形成日/周/月/年报制度。并且最好能够定期对每日不同时段的指标进行跟踪(如以5分钟为周期)。
·分析体系
运营商需要明确的分析体系,针对不同的关注点,以若干指标的集合分析某种特定的网络特性以及满足特定需求的能力。
科学合理的指标分析体系能够准确地反映网络的实际运行状况,正确指导网络的建设和管理。
另外,指标间统计口径的一致性、采集的同步性也会影响到分析的正确程度。
3.4 网络性能与建设成本
由于国内互联网用户规模非常大,如全都明确QoS指标,运营商就必须为此频繁扩容和调整网络,而另一方面,实际网络的运行效率会非常低,反映在利用率等指标的下降。对于运营商而言,工作量和承受的压力将过大,并且付出的成本代价也非常大。
因此,网络性能的考评和指标的确定应基于满足全网绝大多数用户和绝大多数业务的前提下进行,而不必苛刻地要求所有性能参数都十分理想,并且还应在质量指标和效率指标间寻求一定的平衡。
3.5 网络性能与用户体验
实际上,目前国内商业用户和住宅用户并没有明确的QoS要求。由于网上缺乏真正的宽带应用,大多数用户仅仅要求“感觉上”的高速,即仅对时延敏感,而对丢包率、时延变动等不太关心。
虽然网络的性能指标能够影响用户业务的使用效果,但实际上还是存在一定程度上的不一致性,这就要求网络性能参数指标的选取和观测方法更为贴近实际用户的感受,这一领域的研究还有待进一步加深。
4 结束语
虽然国内互联网的建设和运行已经有十余年了,但随着IP网络向电信网的演进,用户对业务质量的要求也愈加严格。因此对网络的性能进行管理,满足宽带多媒体业务需求,是演进过程中必须考虑的。而国内大型IP网络运营商往往兼具电信运营经验,对于电信网的管理经验十足。但其实IP网基于其技术特点,和传统电信网还是有很大区别的,因此,在IP网向IP电信网演进的过程中,网络的性能管理和控制还是有大量研究工作急待摸索完成的。
参考文献:
1.ITU-T E.800、E.600等建议
2.ITU-T M.2301、Y.1540、Y.1541等建议
3.ITU-T G.1000建议
4.ISO 9000标准
5.中华人民共和国通信行业标准YDT 1171-2001
6.信息产业部电信规划研究院相关研究报告
7.信息产业部电信规划研究院相关模拟试验报告
摘自 泰尔网