5G时代,传输网络架构和业务模型更加复杂,对于海量业务告警和性能等数据上报,依赖专家经验为主的传统运维模式,因为业务质量异常分析和故障定位效率低,故障排除时间长,已经成为了网络运维的制约瓶颈。并且因业务质量劣化等所引起的故障发生后才响应用户投诉的被动运维状态,严重影响用户体验。
为改善5G SPN(Slicing Packet Network)网络运行质量,提高用户满意度,适应网络运维的自动化、数字化转型、推进自智网络建设,辽宁移动采用中兴通讯提供的业务质量保障智能闭环系统方案,在SPN现网智能管控系统ZENIC ONE(UME)上完成了功能验证。该方案在可编排规则的智能故障诊断基础上,通过群障分析和意图维持功能的部署,实现业务状态感知、故障分析定位、业务修复的智能闭环管理,运维方式由人工变自动,由被动变主动,提升网络维护效率和业务安全性。
故障诊断:原子化诊断规则以及DIY规则编排
传统人工运维方式严重依赖专业人员的经验积累,运维工作的效率和质量难以提升。辽宁移动采用中兴通讯智能故障诊断方案,将诊断规则原子化,维护人员可根据不同业务场景DIY编排原子诊断规则,形成可自动执行的诊断方案,系统按方案执行诊断规则和策略,给出网络故障分析和定位。该方案可将成熟的诊断规则快速固化,方便运维人员随时调用,解决了运维知识传递效率低、维护经验积累周期长的瓶颈。同时故障诊断由传统的人工被动方式变为基于规则的系统主动判断方式,诊断时间从传统的小时级别缩短到分钟级别,效率大大提升。
故障定位:业务群障分析,系统主动定位故障,缩短网络恢复时间
网络汇聚核心层网络设备故障情况下,业务影响范围大,业务抢通困难,是人工运维的难题。业务质量保障闭环方案中的群障分析功能可以通过对用户业务对象自动进行业务质量的实时监测,在发现业务质量异常,并且业务故障数量达到群障触发条件时,启动自动分故障共性分析,快速定位故障网元及端口,同时OMC系统基于故障原因给出处理建议,帮助运维人员快速解决故障,故障定位时间由小时级缩短至分钟级。
业务恢复:业务实时感知和智能控制,主动维持业务质量,保证客户体验
维持业务SLA达到用户预期,是网络运维的重点和难点。方案中的业务意图维持功能对重点业务进行自动监测,基于Inband-OAM实时感知业务质量状态,业务质量下降到设定门限后,系统寻找替代路由进行动态恢复,在保证SLA的情况下,维持业务自动“永久在线”,提升客户体验。业务意图维持实现了业务质量的自感知和自修复,相比于传统的人工运维,业务恢复从小时级减小到分钟级,同时实现了极简运维。
辽宁移动和中兴通讯合作的SPN网络智能故障诊断方案,已获得了由SDN/NFV/AI标准与产业推进委员组织评选的2021年度中国SDN、NFV、网络 AI优秀案例。双方将继续深化创新合作,基于5G运维实际需求,丰富智能化运维应用场景,实现自智网络运维质的突破。