保证企业网络应用的集成性

  组织内的企业应用系统的重要性正在普遍地以几何级的速度增长。企业网络上运行的关键应用系统种类,会按业务的取向,采用从SAP、Oracle等CRM应用系统到IP电话(VoIP)到自身开发的应用系统。无论你的组织认为哪些应用系统更为重要,有一件事始终是不变的:如果这些系统运行不畅,无论是因为网络原因还是因为与应用系统服务器有关的问题,企业的效率将被严重地降低。

  比如,一家零售企业可能会因为其面向客户的网站上的应用系统性能不佳而失去很多着急的用户,明显地降低营业收入。一家制造业公司可能会因为ERP系统不良,引起生产线缺货停顿造成不能按期交货,需要承担巨额赔偿金。一家医院因为病历传输慢,不能为其病人提供重要的医疗服务。造成这些应用系统性能不佳的原因可能与应用系统、服务器或者网络有关。

  由于企业内对应用系统越来越多的依赖性,应用系统性能不佳造成的潜在影响,诸如营业额降低、成本和赔偿金或者对客户的不充分服务等问题,都增加了企业的风险。这些不断增加的潜在风险正是改善网络应用系统的集成性的关键动力。

理解网络应用系统的集成性
  
  要理解网络应用系统的集成性前,需要对应用系统性的历史有一点了解。为了优化网络应用系统集成性,重要的不仅仅是理解个别的最终用户、网络、服务器以及应用系统,还要理解这些元素是如何彼此配合的 -这些可能超越了一般网管员以往关注的领域。很明显,网管员不能再只负责连通性和带宽问题了。实际上,网管员也需要密切地参与对应用的监控和故障排除等工作,而这些工作过去都是应用系统管理团队的责任。

  如果企业重要的应用系统是跨网络运行的,分区来监测和管理应用性能问题,是非常低效的。用分区管理方法时,不同的小组将负责企业和网络的不同区域,各自为政 -服务的提供商负责广域网的接入网络和端口,网络管理小组只管理CPE和其使用,而应用系统小组则负责应用系统和服务器。即使有这样的局限性,多数企业使用的都是这个结构。

  保证网络应用系统集成性需要在应用系统和网络资源的交叉点处提高业务、安全和故障排除的工作效能。一般,人们都能了解网络应用系统集成性的价值。然而,多数企业都不太能够详细了解个别应用系统和基础结构之间错综复杂的关系。随着远程用户的增加和不断出现的基于网站的应用系统,如客户关系管理(CRM)系统和企业资源管理(ERP)系统等,网络的压力增加了,网管员的压力也增加了。不断的网络技术发展,从结构替换到MPLS和以太网,还增加了网络经理的责任。

工作地点分散化

  随着商业应用系统变得越来越分散,它们也使得劳动力得以越来越分散。多年以来,商业机构已经借助了信息技术使其走出单一的设施来控制房地产成本,将资源安置于劳动力密集且接近客户的地方。根据Nemertes研究院的研究,这些变化已经发展到相当的程度,只有13%的雇员在总部大楼或场地内工作。

  虽然劳动力分散从整体上为企业带来了成本的降低,但他往往会给IT部门带来负担。每个新的工作地点,无论是只有一个雇员还是有一百个,都必须有一个可以供企业应用系统运行的新环境。为了管理这个过程,高度分散化的行业,如银行,已经开发出了可以严格应用于不同地方的“参考设计”,以将可变性降低到最小。

  不过,即使是在最统一的环境中,因为不同的应用系统使用模式、再利用的陈旧资产以及不可避免的WAN/MAN连接的不同, 因工作现场不同的差异总是会出现。 更糟糕的是,家庭办公令IT部门保持完全统一的环境的努力变得几乎完全不可能,因为家庭办公涉及的连接可能涉及多个ISP和雇员自己的家庭网络。

应用系统的挑战也在增长

  除了要解决越来越沉重的装置结构和组织性问题,网管和IT经理门还得面对数量不断增加的企业应用系统所带来的复杂问题。处理新的应用系统、安全漏洞、带宽攫取以及分布式应用系统,所有这些都带来了挑战。使这样的挑战更为严峻的是网管和IT经理正在试图以少管多(以较少的人力和财务资源管理更多的地点、设备、应用系统等)。

  无论是传统的应用性能工具还是网络管理工具都不能提供网管员为了满足这些新的、不断增加的责任所要求的功能范围。现在,更容易看到一个“鸿沟”挑战着网络应用系统集成性。

网络系统集成性的鸿沟

  今天,不论是哪个行业,不论企业大小,在大多数企业中都存在着应用系统和网络性能之间集成性的鸿沟。这个鸿沟引致在理解、关联及分隔企业网络基础结构和应用系统性能之间的问题方面时的困难。更为重要的是,这个鸿沟强迫网管和IT部门只能被动地解决性能问题,或者采取“救火”式的行动,而不能主动地优化基础结构和应用系统性能。弥合集成性鸿沟要求将每个地点的网络性能数据和应用系统信息关联起来。

  有几种组织性和结构性的趋势使得这一集成性鸿沟变得更宽更深:竖井式(siloed organizations)结构的影响、分散式工作地点以及开放式网络结构。

竖井式企业(Siloed Organizations)的影响


  当今的大多数企业都有这样的结构:一个团队专注于网络基础结构,包括通讯和网络CPE;而另一个团队则负责应用系统和应用服务器。在典型情况向,每个团队都有截然不同的职责及其自有的工具来监督其组件 - 1-3层属于网络团队,4-7层属于应用系统团队(见图1)。这种“竖井式”管理方式,加上网络上越来越多的VoIP和基于互联网等分布式应用这样的新趋势,使得对应用和网络性能的优化变得尤为困难。


图1:“竖井”式企业的影响。


  通常,如果最终用户觉得应用系统“不好用”、“速度慢”或者“性能不好”,他们就会投诉,从而触发一连串的排除故障的流程。典型情况下,网络总是“在被证明无辜以前被看成是有罪的”。所以,负责网络的团队开始测试网络组件,从ping路由器到联系服务提供商来测试核心广域网(WAN)环路。即使网络总是最先受到责备,通常情况下,网络基础结构是健康的。

  多数企业采取的第二个步骤是将问题“转”给应用系统团队。该团队则从个别服务器应用到应用系统性能开始进行测试。多数情况下,因为缺乏端对端(end-to-end)网络连接造的可视度,这些测试往往不能了解最终用户的问题。结果,分隔和解决问题变得非常困难。许多竖井式企业都是用“我们对他们”的心理来对待应用系统和基础结构的管理。不同的团队不是团结一致解决性能低下的问题,而是把问题都推到别的部门,让另一个团队来解决。这往往导致彼此之间的指责。因为大家都孤立地工作,缺乏大家可用的性能数据,健全性鸿沟扩大了。不同的团队在基础结构和应用系统方面只有局部的视野,并且不能了解应用系统、服务器和网络基础结构性能对相互间的影响。

  未知或不曾预料的网络应用在理想状态下,网络团队应在新的网络应用出现前至少三个月就接到通知。有了这么长的准备时间让他们可以测试与性能有关的问题,包括应用、可接受的延迟标准以及对现有的应用的影响。

  不过,在现实的世界里,网络团队对网络上即将运行的新的应用系统的了解很少,甚至毫无了解。网管员经常被迫在应付日常繁忙的工作外,后知后觉地试图了解新应用的影响。除此之外,在对网络组件的了解有限的情况下,要想了解应用从最终用户通过网络到应用服务器再返回到最终用户的过程和状态可以说是千头万绪。这就强化了很多企业只能被动应付问题的特性,等待问题发生,然后再寻找措施解决问题。

案例:

  未知或不曾预料的应用系统一家大型企业正要将其客户支持部门的一部分搬到一个新的地方,以减少费用。网络团队接到搬迁通知,并预备了一个网络来处理新办公场地未来可能有的以及传统的应用。该客户支持团队使用有一个CRM系统,所以应用系统团队在新的办公场地测试了CRM系统,其性能远远超过需求。

  然而,在网络割接之后,CRM应用系统的性能非常差,麻烦开始了。网络团队测试了网络和CPE,所有东西都很正常。应用系统团队测试了所有服务器,发现也是全部正常。经过大范围的测试,花费了大量的时间,人们发行,CRM应用系统过度使用了网络,这导致了应用系统运行的低性能,并严重影响了客户支持团队的工作效率。

  即便网络团队收到了搬迁办公地点的通知,他们并不了解CRM系统要消耗大量的带宽。在搬迁之前,客户支持团队在总部办公,CRM服务器也是安置在总部办公地点内。这一高度消耗带宽的应用系统原来只是在本地千兆以太局域网(LAN)上运行,而现在则使用的是较小的WAN网络的有限资源。网络团队预留了传统远程场地应用所需的网络资源,却不知道新办公地点的实际情况。

带宽攫取

  找到并隔离带宽攫取源可以帮助企业节省许多宝贵的时间和资源。带宽攫取可能产生于授权或非授权用户,用户可能使用授权或非授权应用系统攫取带宽(见图2)。


图2:授权和非授权用户及应用例子。


  当资源有限,网络和应用系统性能收到负面影响时,迅速找到带宽攫取以减少企业风险是非常必要的。

  然而,在出现带宽攫取时,大多数情况都是间歇性的。这意味着使用峰值出现在一段时间,接着就间歇性地回到普通状态。

  对于间歇性问题,隔离和排除问题变得更为困难,耗时也更多,因为你可能总是落在问题的后面。

  使情况更为糟糕的是,多数间隙性问题的影响随着时间的推移会扩大 - 这意味着问题不及早解决将会变得越严重。

安全漏洞 - 服务中断/病毒攻击

  在过去几年里,病毒或服务中断攻击几乎给每个企业都带来了负面影响。有些企业受到的影响可能只有一个小时,而有些企业受到的影响则可能长达几天或几个星期。影响的时间越长,企业的风险就越大。即使有了最强大的防火墙和抗病毒软件,企业的基础设施也可能会面临危险。

  病毒和服务中断攻击的性质造成企业在解决问题方面被动应付,因为你不知道下一个问题什么时候会在什么地方发生。即使在这样的案例中,辨别和排除问题总是被动的,攻击发现的越快,受到影响的最终用户被清理的越快,企业蒙受的风险就越小。

案例

带宽攫取

  带宽攫取的间歇性性质使得它更为难以跟踪和隔离。肯塔基一家中型企业曾经经历过其ERP系统性能低下的情况。网络团队和应用系统团队分别试图隔离原因。但是,在问题解决之前,性能低下的情况就消失了。两个团队不能找到原因,问题不了了之。

  第二天,同样的系统问题又出现了,而且更明显了。

  这一次,两个团队试图再次解决问题。他们在现场找来探测器。两个小时后,就在探测器启动时,问题又消失了。探测器在现场被保留了几天,问题没有再次出现。

  六天之后,问题又出现了,情况变得更为严重。

  肯塔基办公室的效率受到负面影响,网络团队和应用系统团队对找出问题都没有进展,因为他们不能定位这个间歇性的问题。后来,人们发现问题的真正原因不是单一个带宽攫取者攫取了全部带宽,而是大量的用户在篮球比赛期间通过网络收听本地篮球队的比赛转播。

  他们都是授权用户,使用认可的语音流应用,但是对比赛感兴趣的人太多了,这成了出现问题的罪魁祸首。正是联赛中当红的本地篮球队影响了企业的效率!

分布式应用系统

  以前,多数企业都会建立核心数据中心,星型向外辐射到分支的网络结构。基于这种类型的结构,企业会用一个集中的管理平台来监测性能。

  随着IP虚拟个人网络(VPN)和基于多协议标识交换(MPLS)的网络的引入,一些企业启用了部分和全面协调的网络,意味着分支机关可以彼此直接通讯而无需先将应用业务通过数据中心转发。与新结构紧密接轨的是VoIP和基于互联网应用广泛启用的趋势。比如,两个分支办公室之间的VoIP通讯,因为无需绕到核心数据中心,会更高质量和更少受时延所困扰。

案例

安全漏洞 - 服务中断/病毒攻击

  一家制造业公司最近受到一次服务中断的影响。最终用户慢慢也受到影响,不良通讯也开始在网络上传播。总部办公地点有一个高速的网络链路,所以,这次病毒的影响在经过一段时间以后才表现出来对网络的过度应用。一旦网络应用达到了带宽的最高值,用户受到了影响。现在,企业必须作出反应来解决问题。起初,他们要终止病毒通过路由器设置进行传播,接着要努力一个一个地清除受到影响的工作站。

  通常,高速网络链路对应用的性能来说是宝贵的资源。然而,在这种情况下,它反而成了障碍。因为需要很多的用户受到影响,才能把整个链路的带宽占满。这样,问题有足够的时间扩大,造成大量的通讯拥堵和大量用户的感染。最后,解决问题并清除受感染的用户所需要的时间和资源则暴涨起来。

  分布式应用系统的好处在于可以提高效率,降低带宽强度,且减少延迟感。不过,因为不再有通过总部的单一传输点,对分布式应用系统的监控和故障排除就变得越来越困难了。在每一个远程地点保持专有网络和IT员工的可行性非常低。这种视野的限制从而增加了企业的集成性的鸿沟。

弥合网络应用集成性鸿沟

  即使挑战越来越大,网络应用集成性的鸿沟也越来越宽,我们还是有希望的。有三个重要的步骤可以帮助你弥合这集成性的鸿沟:理解应用系统和网络组件,对最终用户的经验的进行深入了解,隔离和解决性能问题。一旦你掌握了这三个概念,你将能实践健全的网络应用。

第一步:理解应用系统和网络组件

  在最近对网管经理们的一次研究发现,很多企业中都存在这一个令人困扰的趋势:四分之三的被调查者说,他们缺乏对网络上的应用系统的足够知识2。一直以来网管员都很了解网络,而应用系统经理了解应用系统。多数网管员了解与路由器、DSU/CSU以及网络相关的问题,当对应用系统实际上是如何运行的却不了解或了解甚少。更重要的是,传统上的两个团队对应用系统和网络之间是如何互动的都没有具体的了解。

  要管理应用系统使用网络的方式,要求对“实际”应用系统以及商业政策有清晰的了解。只有有了这样的知识,IT部门才能作出最好的决定,使应用得到控制。如图3所示,应用系统的“实际”状态和商业的政策的要求是保证健全网络应用的两个共存的方面。


图3: 应用系统“现实”和商业政策问题之间的差别。


  有关应用系统现状的问题就像是报纸记者的笔记本上的问题一样:使用网络资源的应用系统都有哪些?传输负载来自哪里,又去向哪里?谁在使用信息?应用系统需要多少带宽?什么时候需要?

  这些问题的答案构成的改善的基线。

  选择要进行哪些改善?怎样最好地应用这些改善?要回答这些问题,便须要政策。政策问题所询问的事情是怎样才能达到需要的网络状态。

  同时得到这两种问题的答案一直是困难的,因为应用系统团队和基础结构团队都没有信息搜集工具来提供有用的分析。

第二步:洞察最终用户的经验

  为了实现经济效应,IT、网络和应用系统的各个团队倾向于被集中于总部、数据中心或大的办公地点。虽然这些地方往往有更多的雇员和员工,远程地点对企业来说也非常重要,无论是销售部门、配送中心、零售点还是制造工厂。如果这些地方受到应用系统或网络性能低下的严重影响,企业的财务和生产力也将受到影响而造成损失。

  应用系统的用户通常是糟糕的网络应用的首要原因。当网络应用集成性的鸿沟存在的时候,重要应用系统的意外中断或不可接受的性能低落非常难以理解和管理。为了恰当理解对最终用户的影响,企业必须能够监控和管理网络、CPE、服务器和应用系统。当应用流通过WAN核心或其他地方的本地网络,流经本地网络,最终流到应用系统服务器再返回的时候,应用流视图对了解性能是非常重要的。

  如果没有完整的应用流视图,企业只能回到同时管理几个个别组件上,而没有全盘的认识来了解性能低落的原因和影响。

第三步:隔离和解决性能问题

  对当今的企业来说,另外一个重要的挑战是如何隔离造成性能低落的原因。在管理个别组件的时候,非常容易对性能产生狭窄的认识,这可能会导致部门间的互相指责。这些策略只是减慢了发现和隔离问题的过程,而更重要的是减缓了问题的解决速度。

  通过在第一步骤和第二步骤中了解应用系统和网络组件以及最终用户体验,隔离问题就变得更加容易了。通过管理整个应用系统流,查明在1-3层和4-7层之间的问题也就更加容易了。一旦问题被隔离,解决一个特定的问题就更为简单,而不需要在对造成性能低落的原因了解甚少的情况下去同时排除多个领域的问题。

理解应用系统问题的困难

  过去,网管员对应用系统性能了解很少甚至没有了解。然而,在这件事上存在着一个基本的两分法,解决应用系统性能问题的第一步取决于网管员的能力。

  因此,了解应用系统可用性的重要性显然是非常关键的。应用系统可用性是在完成与应用系统有关的任务时用户保持有效工作的时间,如向CRM系统中输入数据时,从下载网页到下好订单的时间,或者通过ATM跨行提款所需要的时间。

  令网管员感到挑战的是有很多组件会影响应用系统的可用性,而这些组件都必须配合应用系统的工作。比如,不仅每个用户都必须访问具备合理性能的应用系统服务器,而且应用系统服务器还必须能够访问应用系统所依靠的所有组件。例如,一位在线零售商在服务器上有一个单独的主页,而该主页分别从不同地点的不同服务器上的过往订单、曾经变化的特殊要求以及个人推荐中提取信息,这些组件中的每一个都必须正确而高效地工作,以使最终用户的体验令人满意。

  测量应用系统响应时间是非常有价值的。

  应用系统响应时间是用户的客户要花多久才能从应用系统服务器得到其所要求返回的信息。该响应时间是两种传输延迟影响的结果,即在一个网页上发生许多分别的传输要求下载对象,以及在每个传输完成的过程中发生的不同组件的延迟。有些延迟是网络设计和预先选择的结果,比如带宽、距离以及跳跃数(hop-count),而有些延迟则是可纠正的异常造成的,如拥塞、掉包以及中继问题。另外,还有一些延迟与网络协议有关,或者与应用系统选择使用网络的方法有关。最后,性能问题还可能是应用系统及其服务器的问题造成的。

  由于缺少工具搜集测量数据并将数据分解到各延迟组成部分,对应用系统响应时间的测量一直都是问题。在很多排除故障的案例中,要想得出有效的结论,长时间地以响应时间为基线并进行跟踪是非常重要的。同样重要的是,能够分析延迟组件来找到性能问题的根本原因。

制定集成性网络应用系统解决方案

  当传统的网络管理与商业应用系统成功交付的所有权相结合的时候,一门新的IT学科就被定义了:集成性网络应用系统。它采用全面的方法反应商业应用系统和用户的远景。该方法要求同时关注应用系统和网络基础结构,以及这两个要素如何协同工作增加应用系统价值,而不是仅关注其中一个要素。

  集成性网络应用系统不仅是一学科,而且还是一个过程。它是一个工程设计过程,通过这个过程,商业应用系统的需要和用户的需要得以与适当的网络资源相匹配。它还是一个质量过程,该过程根据需要测量性能。

  为管理应用系统所运行的基础结构而成功实施一个过程并不是一个意外。行业论文“应用系统性能管理”的作者Lynn Nye说:“对应用系统性能管理的坚实理解和交付必须基于一个事实,那就是网络和应用系统共同构成体系。体系的结构设计和配置是为了给用户提供反应迅速的性能和业务上的成本效率。”

  集成性网络应用系统基础结构本身必须为管理而设计,这是很关键的一点。虽然它不需要在一夜之间完成,但它的确需要在一段时间内有目的地得以实现。升级基础结构的决定也应该总是兼顾到改善管理能力。

集成性网络应用系统的组件

  IT组织依靠只依赖在网络要素的任意方面,如CPE、网络、应用系统、服务器等,管理网络和应用系统的工具上是不够的。新的工具需要跨过简单的网络和设备管理范例,来使网络应用系统集成性的过程得以实施并自动化。

1.支持集中的方法

  作为基础设施的一部分而部署的方案将使基础结构管理的集中方法得以实现。只有在该方案包括了后端服务器和数据库以将管理数据放在一起的时候,对整个基础结构的全盘了解才有可能。然而,同样重要的是,集中系统不要变成“管理信息岛”。

  最佳的解决方案使得管理信息能够在管理系统的不同组件中迅速交换,以实现从警报管理到集中化报告的各种功能。另外,同样重要的是该系统要能够随着基础结构的成长而成长 - 要能存储足够数量的数据,要有足够的方法从基础结构中采集数据,要有足够的案例以供分析。

2.提供完整的应用系统可视性

  IT经理们需要详细、准确的信息,这样他们才能在给重要应用系统分配适量网络资源的同时,确保其他应用得到控制。这意味着对部署于整个企业内部的应用系统获得完整的认识 - 不只要了解有哪些应用系统(现实),而且还要了解它们从哪里得到服务,它们对谁服务,服务的频率如何。



3.实现信息控制策略

  控制带宽是集成性管理网络应用系统的一个最基本的工具。在不同场合和不同时间里,几乎所有的业务都曾尝试过通过分配带宽来解决应用系统问题。问题是带宽并不总是按照你的愿望到达你想让它去的地方。

  IT经理们必须回答一个紧迫的问题-是否需要增加带宽?他们还必须算出要增加多少带宽。有了正确的信息,就能够调整应用系统使用网络的方法,或在路由器中采用基本的传输队列方法来使网络应用更加顺畅。集成性管理网络应用系统的工具必须提供足够的细节来引导经理们就带宽问题作出正确的决定。

4.经验质量测量

  集成性网络应用系统的关键整体指标是最终用户的质量体验(QoE)。应用系统可用性和应用系统响应时间决定了QoE。一个有价值的管理工具可以测量这两个要素,并将这两个要素分解到相关组件。将这些要素跨过物理和逻辑结构进行划分可以提供改善性能的线索。

5.将应用系统问题和基础结构根本原因联系起来

  如果不能迅速地解决问题,再好的应用系统性能分析都是没有用的。只提供应用系统分析的工具在揭示基础结构问题方面的能力是有限的。集成性管理网络应用系统要求能够直接将最终用户QoE的不良体验与根本原因相关联,无论问题是IP层上的服务等级,还是在物理层上的错误。同样重要的是,该工具还必须将应用系统的带宽要求和第二层所提供的带宽相对比。

6.量化业务影响

  即使是最有说明性的应用层分析,也只有能够清晰表示业务之间的关系时才是有用的。对了解受响的用户,对了解性能问题的变化,对分配资源的优先性来说,其价值是无法衡量的。这对防止性能降低也是非常重要的。


图4:网络应用系统集成性解决方案。


集成性网络应用系统的前景

  今天,已经有了无数种管理方法供企业选择。但是,大多数解决方案都不能满足全面网络应用系统解决方案的要求。报表系统解决方案是静态的,不能提供足够丰富的、用于排除故障的数据,而单一地点的解决方案不能管理较大的系统或复杂的分布式结构应用系统。大型的管理框架为大量设备和地点提供了“自上而下”的状态,但充其量只能起到一个‘仪表盘’式的简单指示作用,而不能为隔离和解决问题提供详细信息。

报表系统 - 在需要迅速解决的问题方面反应迟缓

  在提供基础结构整体情况方面,或者,在生成用于面向高级管理层的报告中的图表方面,报表系统是非常理想的工具。报表系统通常从各种SNMP设备以及其他管理系统中收集数据。它们还可以总结信息,将数据以图表的形式表现出来,甚至可以在线发布这些数据。

  不过,这些系统往往在丰富性、质量以及所提供的信息的表现形式方面有缺陷。由于受到来自各种设备的定期数据的限制,大多列出SNMP MIB,这些报表系统往往不能提供辨别性能问题产生的根本原因所需的深度信息。在排除重要的性能问题方面,报表系统的效率也不够,就像用一桶水试图浇灭整栋房子里的大火一样。

单一现场管理工具 - 缺乏可扩展性

  单一现场管理工具对一个较小的环境来说非常理想,它可以对应用系统通讯提供全面的信息,以便深入了解网络使用情况。由于没有后端系统,工具自身使用Web GUI,这样的工具非常易于部署和维护。

  不过,单一现场管理工具不能提供最好的分析,特别是对正在增长或更为复杂的网络来说。在需要增加工具来管理更多的现场的时候,成本会很高。当需求增加的时候,单一现场管理工具在同步增长方面也有严重的问题。

  即使增加现场管理工具仍然不是最佳解决方案,因为IT部门仍然缺乏对所有层面的传输量的了解,而这往往正是性能问题的根本原因所在。部署多个管理工具的公司很快就会发现,它们没有一个集中化的管理系统来将所有的信息归纳到一起。所以它们经常需要构建数据库,以便对网络情况有全面的了解,并将这些信息与其他管理工具共享。

大型管理框架- 在所有任务方面不够理想

  有些大型公司使用一个管理框架产品,将IT环境中的大多数因素的管理能力都囊括进来,其中包括路由器、CSU/DSU、网络线路和服务器。这样的管理框架在监控一个网络内跨多个组件的基本状态(如“红灯/绿灯”)方面表现良好。不过,这一方法的问题在于多数这样的系统仅仅善于基本监控,而其他方面的能力则平淡无奇甚至相当糟糕。比如,一个单一管理框架可以通知网管员在某一地点出现宕机情况,但往往它不会提供强大的隔离和排除故障的工具,来判断问题的原因是电源中断,CPE故障,带宽被不正常流量占据还是网络中断。

  企业往往将采购单一管理系统作为其将管理部门标准化,降低其控制成本的方法之一。最初,它们可能受益与这些系统的质量特点。不过,经过一段时间,它们可能就会发现这些系统缺乏能力承担所有重要的管理任务。拥有长期使用这类系统的经验的企业往往经历着在这些系统上的低投资回报率,而且需要采购补充管理工具。

UpTime®SelectTM产品:优化集成性网络应用系统

  通过UpTime®SelectTM产品, Visual网络公司将性能管理工具提升到了一个新的高度。这一全面的解决方案是集成性网络应用系统的理想产品,有助于企业弥合集成性鸿沟。该系统为IT经理们提供了一个在整个基础结构中分析应用系统和网络组件所需要的工具。

弥合集成性鸿沟

  VisualUpTime® SelectTM产品是为企业提供的一个全面的、单一资源的解决方案。该方案可以有效地管理网络应用系统集成性中的七个关键部分:

1.支持集中的方法

  无论如何部署VisualUpTime® SelectTM产品,其工具都为流经它们的所有数据提供深度数据包检查,以收集详细的应用系统性能即使用信息。这些工具将数据上载给用于存储、分析这些数据的VisualUpTime® SelectTM服务器,并且从每个分析点出发,展现完整的有关集成性网络应用系统信息。VisualUpTime® SelectTM服务器具备若干其他流行管理系统的接口,以将其对管理生态系统的价值最大化。该解决方案的设计满足了服务提供商的要求,在处理最大的企业环境方面游刃有余。

2.提供完整的应用系统认识

  VisualUpTime® SelectTM服务器可以提供全网络的总结性信息,对整个网络上几乎每一个应用系统都能做到全面的监控,包括哪些IT团队以前毫不知情的应用系统。网管员可以深入分析个别的应用系统,找到服务器的地点,看哪些客户在使用这些服务器,在什么时候使用,使用的程度如何。这些可视性提供了对应用系统资源要求的详细了解,以便IT经理们可以微调其性能,而不需再不断地求助于增加带宽这样的权宜之计。

  历史分析和趋势研究有助于找出业务对基础结构的需求在哪里增长,以便IT经理们可以在性能受到威胁之前就做出调整。这些特点还有助于发现未经批准的、像KaZaA这样的应用系统对基础结构的滥用,也能发现为了适当运行业务应用系统,哪里需要更多的基础结构资源。

3.实现信息控制策略

  实施控制战略需要对基础设施使用情况的深入了解。正因为如此,VisualUpTime® SelectTM产品能够找出客户机和服务器之间最活跃的应用系统流,同时提供回溯的能力。分组控制提供了在基础结构任意点上分析数据流信息矩阵的灵活性 - 按应用系统、服务器或者客户工作站。发现传输模式和应用系统表现,从而作出使用控制的决定,数据流信息是非常重要的。这些能力还会在病毒或蠕虫入侵网络时起到作用。VisualUpTime® SelectTM产品可以表现出攻击在基础结构中是如何扩散的,并且能够迅速标识出受到感染并正在传播攻击的机器,以便IT经理们迅速排除故障,解决问题。

4.经验质量的测量

  为了实际了解最终用户对应用系统性能的看法,VisualUpTime® SelectTM产品提供对服务器响应时间、吞吐量以及各阶段详细应用系统传输矩阵的回溯分析功能。这一层次的数据和系统测量网络潜力的能力、吞吐量以及数据包损失一起,在应用系统软件团队和基础结构运行团队之间避免互相指责的同时,帮助隔离出造成性能低下的原因。这些能力还可以形成IT部门及其业务单元客户之间应用系统SLA的基础。

5.将原因和系统问题关联在一起

  无论性能问题发生在哪里,VisualUpTime® SelectTM产品独特的挖掘功能都有助于发现性能问题的潜在原因。与那些关注应用系统层的解决方案不同,VisualUpTime® SelectTM产品分析所有的层面和所有的时间,并将分析结果存储于一个数据库中。这样,当系统问题出现时,IT经理们就能立刻一层一层地在历史数据库中挖掘,以揭示问题的原因。VisualUpTime® SelectTM产品已经存储了这样的分析,而其用户界面也很容易找到。

6.量化业务影响

  IT经理们可以依靠VisualUpTime® SelectTM产品对应用系统、现场测试以及受现有问题困扰的用户来话可以获得更好的认识。通过迅速找到、隔离和排除在第1-7层的性能低下的问题,通过改善集成性网络应用系统,会大大降低负面影响。

  最后,VisualUpTime® SelectTM产品是一个易于部署的解决方案。通过弥合集成性鸿沟、优化集成性网络应用系统,它能够为IT机构和企业从整体上提供结果。

VisualUpTime® SelectTM产品在现实世界的案例

  在本白皮书的较前部分,若干发生在真实世界中的案例说明了优化集成性网络应用系统的困难:未知或不曾预料的应用系统,带宽攫取,安全漏洞。当我们突出介绍VisualUpTime® SelectTM产品在发现、隔离和排除这些问题时所表现出的能力时,每个情景都得以重新评估。

未知或不曾预料的应用系统案例

  一家大型企业将要将其客户服务部门搬迁到一个新的地点。客户支持团队现在通过WAN应用一个CRM应用系统。当割接的时候,企业的整个客户支持机构受到了负面的影响,直到几个星期后对网络进行了升级。并没有灾难性的原因导致了这样的问题,而是因为在网络团队和应用系统团队之间缺乏沟通造成的集成性鸿沟导致了这样的问题。在这个案例中,该企业没有足够快地找出问题 - 甚至在问题被重视之前,最终用户已经受到了严重的影响。现在,让我们看看在同样的案例中,VisualUpTime® SelectTM产品是如何提前侦测到问题的。

VisualUpTime®SelectTM产品案例

  网络团队提前准备了网络,测试了CRM应用系统一切正常。然而,一旦所有的最终用户访问CRM服务器的时候,网络出现了超负载现象。网络团队按照传统的应用做了准备,而不知道过去在LAN上运行的CRM用户和服务器现在要在WAN上使用。企业不得不等待几个月的时间来重新部署新的网络。

  VisualUpTime® SelectTM产品自动发现整个网络中的应用系统。在测试的前一天,CRM应用系统并没有在WAN上(见图5)。


图5: 测试CRM前一天整个基础结构中的应用系统。


  所以,在测试中,当CRM应用系统第一次接触WAN时,最终用户可以很容易地看到一个新的应用系统出现在基础结构中。因此,就没有必要去寻找新的应用系统了,因为VisualUpTime® SelectTM产品可以自动发现它们(见图6)。

  通过挖掘,网管员可以确定这是两星期来第一次发生。另外,通过观察个别的应用系统流和最终用户,第一次CRM测试可以很容易被发现(见图7)。带宽攫取案例


图6: 自动发现CRM应用系统第一次通过WAN。


  有了测试方面的知识 ,这些知识在六个星期前就已经获得了,网管员早就联络了应用系统团队,看为什么CRM应用会在WAN上。也许,继续向客户支持是业务上的需要。然而,企业可以进行更密集的测试,在新场地启用前就确定需要多少带宽是的足够的。在最终用户受到影响前,企业可以恰当地设计基础结构的大小,而无需让他们在受到负面影响后再等待四到八个星期。


图7:轻松地找出客户于CRM服务器之间的通讯。


带宽攫取案例

  在第五页所列举的带宽攫取案例中,企业花了一个多星期去排除故障 - 而从头到尾也没有解决!间歇性问题往往给解决问题带来最大的痛苦和困难,因为它很难知道什么时候在哪里去观察。在这个案例中,授权用户访问了合法的应用系统(篮球锦标赛的语音转播),因此造成了严重的网络衰落。要想找到这些影响其他重要应用系统的用户和应用系统几乎是不可能的。现在,让我们看看同样的情况下,有了VisualUpTime® SelectTM产品,要想找到他们,要想进行前摄性管理可以是多么容易。




安全漏洞案例

  即使有了最强大的防火墙或入侵侦测攻击,企业也很容易会在安全漏洞出现时受到攻击,无论是病毒、蠕虫还是服务中断的攻击。防止攻击是第一线的防御,但是,如果出现了安全漏洞,发现和清除受到影响/感染的用户所需要的时间对降低风险就显得非常重要。让我们看看VisualUpTime® SelectTM产品是如何能够帮助提前发现潜在的问题,并首先将注意力集中于受影响的用户身上的。


图10: 当ICMP应用超过定制门槛时,用户被找出来。


  正如前面讨论的那样,这个案例中说明了一个服务中断攻击是如何在一段时间内增长的,是如何在高速WAN网络被过度应用,而且更多用户可能会受到影响。有了VisualUpTime® SelectTM产品,用户可以设置按端口或按应用系统设置使用门限,以便在问题发展到不可收拾之前就找出潜在的问题。比如,ICMP是一个可能被用来传播一个攻击(或许它并不具有威胁性)的协议。有了ICMP应用的门槛设置,网管员就可以得到一个警报,以便其可以向下挖掘来确定原因(见图10)。

  有了对ICMP应用堵塞的通知,用户可以挖掘出个别应用系统流来确定原因。IT管理人员可以迅速看到这是否是一个正常的ICMP应用。不过,每个使用ICMP的用户都会走向同一个服务器,看起来疑似一个安全漏洞。只需点击几下鼠标,就能判断是否是一次服务中断攻击了。(见图11)。


图11:挖掘个别应用系统流以看到客户与服务器之间的关系。


  有了VisualUpTime® SelectTM产品,企业可以更为迅速地侦测到病毒传播的模式。IT经理们不需要等待到网络被完全占用,那样会影响更多的用户。另外,IT员工还可以挖掘出客户和服务器之间的关系,并很容易地看到最终用户是否已经被影响,并开始为那些确定已经受到影响的用户执行清除工作。由于更为前摄性而迅速地隔离受到影响的最终用户,VisualUpTime® SelectTM产品降低了企业暴露于安全漏洞之下的风险。

结论

  一直以来,企业依赖重要的应用系统的性能。因此,IT经理们要求高效、灵活的工具,以提供有关整个基础设施的最高程度的可视性。把网络当成铁板一块来管理已经让人不能忍受。网管员们必须考虑网络如何影响应用系统和用户。IT经理们则必须通过营造一个文化,并且在应用系统和网络之间建立组织性结构来弥合集成性鸿沟。

  VisualUpTime® SelectTM产品集成性了应用系统性能分析和网络性能分析功能 - 所以IT部门可以采取一个全面的方法来进行集成性网络应用系统。Visual网络公司的目标是使IT部门可以以业务的形式,基于重要的应用系统来保障高性能。

  通过使用VisualUpTime® SelectTM产品弥合集成性鸿沟,IT经理们可以改善集成性网络应用系统,并且:

□ 通过用对应用系统和网络域的详细了解改善业务性能,提高应用系统可用性。

□ 通过开发更有效的应用系统选择解决方案来降低运营成本,不再总是增加带宽。

□ 通过访问整个基础结构的性能数据来发现未授权的应用系统、带宽攫取、拥塞区域和趋势以及跟踪病毒,前摄性地控制潜在问题。

□ 通过在预算内分配正确数量的带宽来维持应用系统性能来优化带宽。

关于Visual网络公司

  Visual网络公司(Nasdaq: VNWK)是网络和应用系统性能管理解决方案的领先供应商。该公司的技术可以使企业可靠、安全地管理重要应用系统在其基础结构上的交付。Visual网络公司的产品可以提高应用系统和网络的可用性,优化带宽使用,降低传统的和基于IP的基础设施的运营成本。

  美国福禄克网络公司已于2006年2月成功收购Visual网络公司,该公司旗下强大的IP语音(VoIP)生命周期管理方案和应用性能监测方案,将并入福禄克网络公司中。
欲了解更多信息,请访问以下网站:http://www.visualnetworks.com.

参考资料
1“最大化你的WAN,带宽趋势和基准点”,Nemertes研究院,2004年2月。
2 网络世界应用系统性能研究,2003年6月。
作者:美国福禄克网络公司   来源:C114(CHINA通信网)

微信扫描分享本文到朋友圈
扫码关注5G通信官方公众号,免费领取以下5G精品资料
  • 1、回复“YD5GAI”免费领取《中国移动:5G网络AI应用典型场景技术解决方案白皮书
  • 2、回复“5G6G”免费领取《5G_6G毫米波测试技术白皮书-2022_03-21
  • 3、回复“YD6G”免费领取《中国移动:6G至简无线接入网白皮书
  • 4、回复“LTBPS”免费领取《《中国联通5G终端白皮书》
  • 5、回复“ZGDX”免费领取《中国电信5GNTN技术白皮书
  • 6、回复“TXSB”免费领取《通信设备安装工程施工工艺图解
  • 7、回复“YDSL”免费领取《中国移动算力并网白皮书
  • 8、回复“5GX3”免费领取《R1623501-g605G的系统架构1
  • 本周热点本月热点

     

      最热通信招聘

      最新招聘信息

    最新技术文章

    最新论坛贴子