分散应用集中管理的网络结构,在管理网络时较为灵活,却给网络故障的发现和分析带来巨大的困难。所以,必要的实时监测网络性能及主干流量,可为我们发现问题提供有效地分析故障的依据,成为网络监测系统的重要一环。
近年来网络的发展非常迅速,不断采用的新网络技术对网络维护提出了越来越高的要求。分散应用集中管理的网络模式,以其应用灵活、管理方便统一而被众多的网络管理者所采用。而这种分散应用集中管理的网络结构,却给网络故障的发现和分析带来了巨大的困难。交换机、路由器以及VLAN技术的广泛使用,使网络流量变得越来越分散,普通的测试方法仅适用于共享网络的测试,而对于全交换网络只能是管中窥豹。采用何种手段,才可对网络骨干进行实时的监测呢?
网络维护主要手段
目前,大部分网管中心的网络维护手段主要有三类:网管软件、协议分析仪、便携式网络测试仪。尽管这些工具在网络维护过程中都有着很大作用,但是它们各自在功能上又都有所不足。
网管软件的使用必须依赖于数据源提供的统计数据,网络中具有可网管功能的设备(如交换机、路由器)充当了这一角色。在此情况下,网管所能获得的流量信息的多少将直接受这些设备的制约。获得流量信息越多的设备价格越贵,同时过多的信息采集将大大影响这些设备的性能,而导致网络的性能下降。
协议分析仪虽然能提供强大的协议分析功能,但是它分析内容的准确度和丰富程度则依赖于所能采集到的数据量,而如何能方便准确地采集网络流量,尤其是主干流量,是当前协议分析仪所面临的主要问题。
网络骨干实时监测分布方案图
便携式网络测试仪受功能所限,仅能对底层的常见故障进行分析,适用于现场解决实际故障,对于复杂的网络监控,功能薄弱。
型号 | 说明 |
opv-pe/plus | fluke协议听诊器协议分析软件专家版/tr(含专家分析&远程控制&流量生成功能) |
opv-la | fluke分布式全双工协议分析仪硬件(千兆/百兆、光纤双绞线接口) |
ftap-8x | fluke 8端口光纤测试接口盒(ftap-8m为多模,ftap-8s为单模) |
tap-12 | fluke 12端口双绞线rj-45测试接口盒 |
如此看来,这些维护手段对于网络主干链路流量乃至整体性能都不能进行长期、深层和直接的监测。如此一来,网络的管理就出现了一个真空,而很多潜在的网络故障也许就隐藏其中。传统的测试技术已不能满足复杂网络的测试需求,千兆网络的广泛应用亦使得很多测试设备失去用武之地。
实时监测性能与流量
在这样的网络环境下,当网络发生问题时,现有的故障维护手段和方法都不能在不中断网络运行的前提下接入测试。网管系统由于先天的能力不足,不能获得满意的测试效果,并且,为保证关键网络设备的性能不受影响,也不能过多地增加监测能力,因此通过网管软件进行网络骨干的实时分析和故障分析,就显得功能较低,网络管理者有可能因此失去正确的判断力。所以,必要的实时监测网络性能及主干流量会为我们发现问题提供有效的分析故障的依据,而且这种对网络主干性能的主动监测也必然有机地衔接网管系统和现场故障诊断设备而成为网络监测系统的重要一环,这也充分体现了预防为主的原则。
网管人员通过对网络骨干进行集中的实时监测可以做到:在中心机房或其他地方(远程)直接获得网络主干、关键设备的实时流量情况。所有测试可在不中断网络及网络设备运行的情况下进行 。能够对流量进行深层的流量分析,包括捕获包解码,帮助管理者了解各种应用占用网络带宽的比例。所有统计信息的获得不依赖于任何现有的网络设备,很大程度上减少了网络设备的负载。对于发现的故障进行分析,为进一步调用故障诊断工具进行现场故障排除提供帮助。
那么,使用什么样高效便捷的手段实现对大型网络骨干及关键设备进行实时的监测并进行深层次的流量分析呢?
分析方案
我们为这种网络骨干的监测分析提供了基于Fluke网络测试仪器的解决方案。这套方案的重点在于提供了分布式实时监测与集中式控制管理的能力。方案中使用的设备如表所示。
基于这套方案可以实现:协议分析仪专用硬件数据采集器OPV-LA可以直接接入网络主干进行测试,获得真实的流量信息,并且不会影响网络的正常运行;可以提供网络骨干的统计数据和详实的测试报告;可以通过协议分析软件远程遥控硬件数据采集器进行流量分析,从而实现真正意义上的集中管理;提供深层流量分析,得到高层应用协议的统计数据,如各层协议应用比例、点对点的通讯流量统计等。测试设备软件管理和硬件控制灵活结合。TPA的引入提高了测试设备端口利用率,减少测试设备投资。
在实际的网络环境中,可将测试设备接在主干链路中或者关键的服务器、路由器处,和网络无缝地融合在一起而成为网络的一部分。灵活分散的监测和集中控制管理的结合成为本方案的一大特点,基于硬件的准确的数据采集和远程监控分析是本方案的基础。
摘自《中国计算机报》2002.22