企业从信息化到互联网化、数字化的过程中,对IT运维提出了越来越高的要求。原来是技术驱动IT运维的发展,现在是通过数据驱动,运维不再单纯考虑IT可用性问题,而是从决策、管理和解决业务问题的角度为企业发展提供支持。企业在数字化转型的同时,运维也在不断地数字化,使决策更加便捷,管理更加高效,解决问题更加精准。
什么是业务运维
云智慧的业务运维是一个以大数据技术为基础的平台化解决方案,完整覆盖企业所有业务系统和IT系统,通过全链路监控、端到端应用性能管理,以及实时的运维大数据和业务数据关联分析与可视化展示等,持续提升业务效率和IT管理效率,有效连接IT与业务。平台包含了基础设施监控、用户体验监控、应用性能监控、网络性能监控、业务监控、日志分析和智能故障预警。
场景一:IT故障的快速定位和根因分析
在企业中,大家常会看到这样的场景:发现业务系统无法登陆,或营业数据出现异常波动,打电话到IT部门询问,IT运维人员立刻开始手忙脚乱地用各种工具排查故障原因……
业务系统健康、稳定运行是业务正常开展的前提,也是IT部门的基本职责。对IT部门来说,先于业务部门发现故障,就可以提前向业务部门发出警示,或在接到业务部门质询电话的时候,给出更放心、更准确的答复,从而有效提高业务部门的工作效率和质量。
云智慧业务运维系统是实现业务故障早发现、早处理和根因分析呢?
首先,业务运维系统凭借自身的平台化能力,将原本割裂的各种监控数据,如网络设备状态、业务网站性能、关键业务API及事务流程、CDN加速效果、云主机状态等,通过智能数据过滤、关键数据识别对关键的性能指标数据进行汇总,实现运维监控数据的统一管理。
然后,依据事先设置好的告警策略,对告警事件进行优先级和重要程度排序,并将故障信息第一时间发送给IT部门。故障信息的通知方式是多种多样的,包括移动App、短信、语音、邮件、URL回调等,确保信息及时、准确地送达。
最后,运维人员利用业务运维平台提供的"故障快照"功能,可以准确还原故障现场,进行IT故障的快速定位和根因分析。
有了业务运维系统的快速排障能力,业务系统的可用性大大提高,IT部门的工作更加从容有序,避免了过去四处救火、疲于奔命的状态。
场景二:跨应用系统的关联分析
在很多企业,特别是大型集团企业中,核心业务往往不是由单一系统支撑的,一个业务的完整流程需要访问多个平台、不同语言开发的应用系统。同一业务的多个支撑系统,往往是由不同的开发团队或外包服务商提供的,代码规范性和一致性较差,后续的支持和维护也由不同的运维团队来完成的。
这就为企业带来了巨大的挑战。首先,多个支撑系统各自为政,使企业很难了解业务的完整流程和全局状态;第二,当出现问题时,业务人员协调各应用系统,分别进行自查分析,缺乏协同管控,导致业务问题迟迟不能解决;第三,传统的监控管理工具,只能解决单一系统的性能或故障问题,无法解决跨系统问题追踪的难题。
云智慧业务运维平台以企业现有IT监控系统和日志数据为基础,使用智能数据采集器从应用性能管理软件、系统日志、Zabbix、ITSM等多种监控管理系统中获取性能相关指标数据,通过大数据平台的建模、处理和指标关联后,用大数据方法将业务流程完整地梳理和展现出来,帮助企业了解业务处理过程中各应用系统的调用关系、业务运行状态及性能表现。
建立业务关键指标及性能之间的关联模型,从采集的海量历史数据中分析性能与业务之间的非线性多因素关系,从事后的影响评估、事前的What-if预测分析等多个方面来考虑性能问题对性能的影响,甚至可从业务的角度反向驱动业务对性能的要求。
例如,国内某大型物流集团企的业务流程非常复杂,涉及到供应链管理、库存管理、审批流等等,每笔交易都很关键,一旦某个业务环节出现问题就会造成严重后果。云智慧业务运维帮助客户将整个业务流程完整地串起来,并将跨系统的业务拓扑通过大屏幕清晰地展现出来,客户能够直观地看到业务的完整流程和运行状态,及时知晓到并解决业务问题。
过去,这家企业在业务出现问题时,往往需要一两周时间才能排查出问题,而云智慧运维系统将问题处理时间缩短到一个小时。
场景三:企业IT资源一体化管控
随着"互联网+"转型的深入,企业不断加大数据中心、虚拟资源、网络、应用、安全、运维服务等IT资源的投入,使整个IT系统的规模越来越大,复杂度越来越高。随之而来的,是企业越来越难以掌握IT资源的运行状况和利用率,IT资源的规划和决策也缺乏全面、真实数据的支撑。在这样的背景下,IT资源的一体化管控,就成为了一个非常现实的问题。
云智慧业务运维建立的统一IT数据采集、管理和分析平台,实现各分散IT系统数据的集中采集、统一管理和统一展现。通过大屏幕,企业的IT管理者可以多维度、多视角地了解各类IT资源的运行状况和利用情况。
同时,业务运维平台可以统计出不同应用系统功能模块和所调用服务、使用时间、频次、处理耗时等指标。依据这些分析数据,企业可以对臃肿的业务功能模块进行合理有效的"瘦身"和优化,从而大幅提高系统的运行效率。
在及时了解全局业务状态的基础上,企业可以不断改进业务流程,优化IT资源配置,从而让运营更高效,让决策更科学。
总结:智能业务运维平台的数字化价值
企业的数字化程度越高,运维的管理难度也越大,云智慧智能业务运维解决方案能够帮助企业有效降低运维难度,让IT更好的支撑业务。通过平台化带来的可扩展性,充分满足企业数字化进程中不断变化的运维需求,实现IT引领业务、引领创新的目标。
随着人工智能技术的不断成熟,云智慧将赋予业务运维平台更多AI和大数据的能力,打造新一代的智能运维体系(AIOps),为中国企业的数字化转型提供更聪慧、更有力的支持。