随着5G技术不断的升级更新,相关的应用范围也在不断地拓展扩大,行业应用对网络建设提出了更严苛的高带宽、低时延等要求。以往通信网络越来越集中式的网络形态正悄悄地将部分计算能力向边缘演进。此时,运维系统架构、运维操作场景等都在发生着巨大的变化。集约化运维的大背景下,如何与边缘运维有机的协同,变得尤为重要。
什么是边缘计算?
“边缘”一词来自抽象的地理区域,分布式计算就发生在当今的云技术环境中。一般来说,“云计算”由一组连接的服务器组成,这些服务器群集在一起,以防止服务器级的故障。未来,移动边缘计算(MEC)是5G的一个重要应用场景,在移动边缘计算领域,通过边缘节点的下沉,能够进一步提升业务体验指标,优化提升用户感知。
为保证包含边缘节点的系统部署迅速,运行稳定,需要有一整套完整的自动化边缘运维系统来支撑边缘计算整体架构。
什么是边缘运维架构?
根据ETSI协议规范定义,边缘计算网管系统,由NFVO、MEAO、EMS、MEPM、VNFM(含MEP LCM和APP LCM)等管理节点构成。
同时,网管系统向上还可以对接业务运营系统,提供边缘业务开通、变更和监控能力开放等能力;向下对接边缘节点,实现对节点资源和业务的部署、生命周期管理、配置和监控保障能力。
图1:MEC标准架构图
可以看到,这样的运维架构较原有运维系统又多出若干管理节点,整体复杂性大大提升,给运维系统的建设及日常运维工作均带来很大的挑战,具体包括:
挑战一:APP统一管理。边缘应用APP种类繁多,部分APP具备CT特性,可提供原CT应用包的全部部署要素;部分应用仅有部署包,并且仅需要基本实例化部署,不需复杂特性;还有一些应用,并不需要网管编排器来进行编排实例化,仅需分配相关的虚拟资源即可。多种部署方式对于部署管理节点的要求就是多样的,需要分不同场景来支持;
挑战二:APP部署形态不同,相应的资源池需要统一管理。部分网元采用虚机形态,部分网元采用虚机+容器形态,部分网元采用裸机容器形态。对于不同部署形态的网元,编排管理器均要能完整的满足其部署及管理要求;
挑战三:管理域多节点协同。从图中可以看出,MEC管理节点众多,各管理节点如何有机的协同合作成为关键,如OSS发起APP部署过程中,如何将APP接入MEPM中,如何完成APP的初始配置及规则下发,如何选择及限制APP需要的Service。
边缘云管解决方案分析
首先,我们需要梳理在边缘云管理节点中,一共需包含的管理节点:
1)MEAO通过调用NFVO/VNFM能力,实现对于UPF、MEP等虚拟化电信网元的生命周期管理能力;
2)MEAO调用NFVO/VNFM能力,实现对于MEC APP的生命周期管理能力;与边缘云节点VIM/CISM实现第三方APP等业务的资源发放;
3)MEAO调用边缘云节点EMS/MEPM实现UPF、MEP的业务配置能力;
4)EMS实现对于UPF的运维管理能力;
5)MEPM实现对于MEP的运维管理能力,管理APP的规则和需求;
6)各类运维管理工具,实现边缘节点资源池的监控、巡检、故障分析定位等能力;
第三方应用管理系统通常由第三方应用厂家配套提供,实现对APP业务的管理能力,即第三方应用的EMS。
图2:多个管理节点的融合,降低运维复杂度
边缘节点管理自动化,让运维更智能
对于边缘云节点,其运维的总体要求与中心云运维要求相当,其中包括规划设计、部署、维护、优化运营等。但边缘云由于其特有的灵活、小、节点多等特点,决定了对于边缘云的运维,必须引入足够的自动化能力才能方便对众多的边缘节点形成有效的运维建议。
设计自动化:通过采集网络话务模型参数,可自动识别当前及未来一定周期内的网络容量,根据资源模型折算为系统需要的资源数量,包括边缘节点数量等,可提前告知规划设计人员进行网络扩容或新址开通。
部署自动化:边缘节点可能数量巨大,如果均采用人工逐个部署的话,会导致时间过长,容易出错,成本较大等系列问题。边缘节点自动化部署,要求在完成核心数据中心部署后,边缘节点可以实现即插即用,自动化安装部署,边缘设备一旦上电完成后,配置数据自动加载,业务自动激活,达到无人化操作,提交部署效率,缩减部署成本。
同时APP部署采用分级管理体系,部分APP采用标准部署包进行部署,可增强部署要求,提供完整生命周期能力;部分APP可采用简化部署方案,缩减部署成本,提高部署效率。不同场景不同要求可采用不同的方式。
运维自动化:为高效地管理边缘节点,降低运维复杂度和成本,边缘计算运维管理系统必须具备网络自感知、自调整等智能化闭环保障能力。最迫切需要解决的是通过智能算法实现问题快速定界定位,找出问题根因,让问题解决更加高效。
同时,目前网络策略仍是基于人工静态配置,忽略了网络的实际情况。引入AI后可基于时间、位置和移动特性等因素,结合网络中的流量、拥塞级别、负载状态等进行智能分析和判断,通过AI训练平台输出动态策略,实现智能化调度。
优化运营自动化:实时/历史智能分析可提供健康评分、异常检测预测、故障根因分析等参考数据,据此执行配置优化、资源弹缩、问题定位等操作,实现边缘运维闭环优化。
采用完整的边缘运维解决方案,可以系统性地将核心数据中心运维与边缘节点运维有机的结合,互相协同,让边缘节点发挥更大在边缘位置所应有提供的业务能力。在5G网络中,边缘计算节点将给用户带来极致的客户体验,运维系统将全面将传统静态、以人工为主的被动式运维模式向动态、以自动化为主的主动预测式运维模式转变,完成5G网络应该具备的智能化能力。