近期,为贯彻落实中国电信集团云网运营数字化转型战略,提升云网监控排障能力,不断积极探索提升网络自智水平的方法,湖北电信联合中信科移动针对网络维护中故障定位效率低、设备隐患监控识别难的痛点,推出基于AI引擎的智能运维解决方案,实现了故障根因精准定位、设备隐患提前识别,有效提升了网络稳定性。
告警自智—提升分析处理效率
为了降低维护人员日常告警的分析工作量,基于历史告警,提取网络拓扑、配置、日志、故障对象等信息的关联特征,结合已有告警知识库,利用AI算法对数据进行挖掘和训练,形成告警的根因-衍生关联模型。在注入AI模型后,可以对网络中产生的告警进行关联识别和根因诊断,从而提升故障排查与处理效率。
在现网规模试点,告警关联准确度超90%,根因告警分析用时缩短了5~8倍,显著提升了故障排查与定位的效率。
图1 告警自智诊断结果
设备隐患识别预测—主动运维,提升网络质量
为了将设备隐患扼杀在初期,将“健康体检”理念引入到网络运维,对无线网元的关键器件进行健康度评估。通过监测关键指标的状态和变化趋势,结合AI训练模型,可对光模块、时钟源、BBU/RRU输入电压等指标实现健康度自动监控,形成关键器件的健康评分并输出检查报告,对风险器件提前预警,协助运维人员提前识别处理。经现网规模试点,故障隐患识别准确率达到90%以上,并经过上站核验,评估和实际情况相符,为主动运维提供了重要依据,提升了网络质量。
图2 光模块品质监控
通过规模试点,充分验证了中信科移动基于AI引擎的智能运维解决方案,可有效实现告警根因快速精准定位、设备隐患提前识别,不仅可大幅提升运维效率,而且有效提升了网络设备的稳定性。
后续,湖北电信将持续与中信科移动紧密协作,打通智能运维数据和上级采控平台的对接通道,共同推进网络自智能力更上一层楼,构建更智能的5G网络。