2011年电信集团明确提出将宽带网、C网、WiFi网络打造成三张可管、可维、可控的运营级精品网络,对于WiFi网络而言,意味着将运营级网络的主体从传统的数据机房侧延伸到了用户侧。因此WiFi网络的运营化发展,在现阶段成为网络运营商的一个重要课题,其起点和要求均比现存的其他运营类网络高。这其中,一个高效的WiFi网管平台将是WiFi网络运营化的重要保障。
一、 WiFi网管平台的定位与发展
WiFi网络的发展分为三个阶段:网络建设阶段、运维管控阶段、业务发展阶段。每个阶段都具备阶段化的运营级目标:
WiFi网管平台也需要据此明确自身的阶段目标,制定网管发展的阶段性工作:
WiFi网管平台包含专业网管系统和综合网管系统,二者具备互补关系。
综合网管继承多厂商的AC数据,综合管控能力强,但不适用于日常运维中的故障定位和故障监控,一是因为AC厂商的技术标准不统一,综合网管的技术分析和处理能力弱。二是因为综合网管处理资源多,设备轮询时间长,不适应适时维护的需求。在网络建设阶段,综合网管基本能满足相应的网络运营的需求,但到了运维管控和业务发展的阶段,综合网管能力不足的问题变得越来越明显。
专业网管由各厂家专门开发,其数据适时性优于综合网管,技术处理能力强,但网管局限性高,不适合整体网络的运营分析和管控。需要注意的是,由于在初期的网络建设阶段专业网管的作用不明显,因此容易造成运营商和厂商对专业网管开发和建设的忽视,从而会制约后两个阶段WiFi网络的发展。
对于运营级WiFi网络而言,综合网管的主要作用是网络整体的综合管控,是管控流程中的重要环节。专业网管的主要作用是网络性能的技术处理,是运行维护中的重要工具。
二、 WiFi网管平台的阶段化能力构架
1. 网络建设阶段的网管构建
该阶段的目标是网管的网络架构和功能架构满足网络阶段性发展的需求。因此主要工作就是网管基础功能的实现和规范化架构的设计。
在网管的网络架构方面:各WiFi厂商建立各自独立的专业网管系统,集中形成WiFi专业网管局域网,与AC网络通过网管防火墙对接。各城域专业网管系统通过运营商内网,与省级综合网管平台互通,考虑到数据传输安全性和稳定性,专业网管和综合网管之间接口采用WebService接口通道(如图1所示)。网管平台的数据采取逐级传递的模式,AC将数据传递给各自的专业网管,专业网管按标准的数据定义接口将数据传递给综合网管。AC数据逐级传递方式相比目前运营商普遍采用的AC数据直递综合网管方式,其优点在于,做为流控关键环节的综合网管,可以忽视因网络调整、设备升级、工程建设带来的AC数据结构、AC资源异动,只接受由专业网管经过内部处理形成的标准化北向数据,在网管数据负载量不变的情况下,减少综合网管的采集程序异动,保障流程管控中数据来源的准确性和稳定性,保障综合网管在后期阶段与各类业务运营系统的多元化对接。
图1 WiFi网管平台组网图
在网管的功能架构方面:综合网管应具备设备数据模块、故障管理模块、报表统计模块、网络指标管理模块。在数据库结构设计上,需要考虑到后期阶段中工程资料和维护资料的区分,能够方便后期阶段的工程资料数据库、维护资料数据库的分库改造。在数据接口设计上,需要考虑业务发展阶段的多SSID业务、多业务系统对接,预留相应的软、硬件接口和业务管理模块。专业网管除了传统的设备数据模块、告警管理模块、报表统计模块、北向接口模块之外,还需要增加位置视图模块,预留性能监控模块,其中位置视图模块将AP设备与位置信息、热点信息相关联,便于WiFi特有的热点性能分析、热点资源管理和报表统计工作,由于WiFi网络核心设备AC是为了保证AP的数据准确性和运行稳定性,不宜进行与维护无关的过多操作和配置,因此将位置信息的建立放在了网管侧。不建议在AC上进行位置信息的配置和操作。
WiFi网管的建设,必须及早重视对源数据处理规范的要求,否则在后期阶段会以蝴蝶效应的方式引发一系列的问题。首先,网管必须真实展现所有AC源数据,保证读取AC数据的准确性、完整性,不允许对冲突数据,错误数据做归并处理。这类错误在多个厂家的网管上均有发生,引发了数据配置错误检查、资源统计、指标统计、故障流程处理等方面诸多问题。其次,网管的关键字段索引需要合理设计。传统的AP索引以MAC地址做为关键字段,当运维过程中AP异动后,需要在专业网管、综合网管、运维流程各环节均修改MAC地址,在海量AP的情况下,数据和资料准确性无法保障,造成运维流程、业务流程失控,因此,AP索引应该以AP编号做为关键字段,为每个AP定义一个AP编号,MAC地址只做为AC上的一个AP参数进行调整,流程各环节只识别AP编号,AP资料在工程验收时一次到位,运维过程中无需维护。网管在各功能模块设计时,均应围绕AP编号来进行处理,做到数据录入、采集时一次到位。最后,网管的数据库结构必须合理,符合数据库架构设计原则。网管数据库需要建立单独的外来源数据表、网管新增资源表(位置视图表)、数据处理最终表,将外来设备数据、自身新增数据、网管展示数据在结构上分开。避免在海量数据的情况下,造成额外的资源处理负担,同时避免在后期阶段的部分需求功能无法实现。
在网络建设阶段,网管功能主要满足工程建设的需求,同时满足基本的运维需求。定位在流程管控的综合网管,主要实现三类功能:网络指标的管控与分析、工程建设资源的管控和接口故障派单系统。而定位于技术处理的专业网管,也实现三类功能:建立位置视图,AP数据实现模糊查询和数据配置错误检查。图2和图3分别展示了两种网管的主要应用:
图2 综合网管工程建设资源图:AC资源统计表提供给网络建设等相关部门辅助建设设计的工作。
图3 专业网管数据配置检查图:帮助建设、维护人员检查AC数据配置准确性,减少AC操作负担。可检查的错误类别包括:AP编号重复、AP编号配置错误、MAC、序列号、型号数据配置错误、业务VLAN准确性、AC来源准确性、割接数据未删除等。
2. 运维管控阶段的网管改造
该阶段的目标是保障网络运行的稳定性,因此,网管系统功能需要满足流程管控中优化调整的需求,满足故障维护中监控分析的需求。同时网管结构上还需要满足海量资源增长带来的负载分担需求,网管平台需要完成一系列改造工作。
网管平台结构需要完成服务器分布式运行改造
在运行维护阶段,网管平台的网络结构改造是首要工作。一般的大型城市运营级WiFi网络,AP数量达到数万,传统的集中式单机网管已不能满足资源处理的要求,容易造成数据丢失,状态错误,运行不稳定的问题。网管系统必须采用分布式结构,将各类功能模块交由专业服务器处理,一般划分为采集服务器、数据处理服务器、系统应用服务器,以达到大型运营商OSS系统的要求,提高数据更新的适时性,保障在流程运转、维护查询、业务分析中数据的准确性。
综合网管需要完成流程管控功能的改造
这个阶段,在流程运转中最大的问题是网络端对端资料准确率不高,其次问题是因工程、用户原因造成的AP不可维。综合网管做为流程管控的定位,需要帮助运营部门解决或规避此类问题,使流程能够正常运转。综合网管的主要改造内容包括:
1) 工程数据库、维护数据库分库管理
改造要点(如图4所示):
分库管理:在综合网管上将工程资料库和维护资料库分开,通过一系列功能模块保障维护资料库的准确率,使各部门可以有效共用网管平台,同时保障各类流程的流畅化,解决因工程设计资料影响运维、业务流程的问题。
网管转维:实现自动转维和人工转维两种工程转维模式。新建的WiFi热点在观察期内达到网络指标的要求,进行自动转维;因用户断电等原因未满足网络指标,但满足设备可管率要求的热点,通过人工审核,进行人工转维。网管转维的模式,规避了因工程原因导致的AP网络不可维、海量的用户侧运营设备验收采样率不高的问题,提升了网络整体的可维性、可用性。网管转维的另一个重要作用是可以管控工程进度,解决工程拖期、工程质量的问题。
资料审核:在转维过程中加入资料自动审核模块,通过建设流程中一些关键部门关键资料的规范化审核,判定资料的准确率,决定转维是否成功,同时下发到相关部门更新准确的工程验收资料。资料审核功能有效的提升了维护资料的准确率。
维护回退:通过关键职能部门的审核,允许部分问题热点从维护库退回到工程库。WiFi网络运营级的主体AP在用户侧,因用户装修、电源等问题造成热点设备暂时不可维,可注明原因和时限回退到工程库,通过网管转维或时限过期后进入网管人工转维模式重新纳入到运维流程中进行运维和考核;同时在运维过程中发现的资料问题,也可以通过回退模式转入工程库,通过网管人工转维模式限定相关职能部门限期解决。通过维护回退,解决用户原因造成的运营级问题,规避维护资料错误的问题,使流程能够正常运转。
图4 综合网管分库管理、网管转维的流程图
2) 网络热点资料管理流程改造
当WiFi运营商向公众客户公布(含有)WiFi热点信息的开放性资源系统,热点系统的准确率、适时性必须得到保障,以提升用户的满意度,避免用户投诉。
如图5所示,传统运营商的热点系统资源管理流程中,运营商的资源管理系统向网管系统和热点系统发布热点信息,更新系统的热点数据,资源管理系统的WiFi信息来源为人工导入的工程验收资料。其弊端在于:
热点信息准确率不高。
热点信息与实际网络符合度不高。
热点信息更新时效性低。
人工成本高。
图5 传统运营商的热点系统资源管理流程图
传统的流程经优化调整后,如图6所示,综合网管系统通过维护库资料自动计算热点信息资源,由综合网管自动向资源管理系统和热点系统发布热点信息。这种模式的优点在于:
人工干预显著降低。
信息更新实时性有保障。
热点信息有效性、准确性有保障。
图6 优化后的运营商的热点系统资源管理流程图
专业网管需要完成监控分析功能的优化
在运维阶段,WiFi网络运行最显著的问题是网络隐患较多、难以发现,如设备版本BUG、设备对接异常、设备负载处理能力不足、AC数据配置错误等问题,引发用户侧运营级AP的运行不稳定,造成无线、有线职能部门之间职责不清,各级维护人员压力过大。这些问题可通过WiFi专业网管发现,进行网络跟踪和定位,解决隐患。
专业网管运维功能的优化主要体现在以下几个方面:
网元性能监控
图7 网元性能监控示例图
专业网管可对WiFi的核心设备AC进行CPU使用率、内存利用率、设备响应时间、设备可达率、License等进行全方位监控,发现因网络隐患造成的AC运行不稳定和性能异常,从而进行故障跟踪和定位(如图7所示)。
【案例】:通过发现某台AC设备响应时间高于100ms,纠正了AC全局参数配置上的错误,避免了此台AC下出现的隐性掉线问题。.
告警统计和高级查询
图8 告警统计示例图
图9 高级查询示例图
告警统计和高级查询功能(如图8和图9所示),可使用在各类网络问题跟踪、定位的故障处理过程中,在遇到突发重要故障、大面积故障时,通过发生时间、故障范围等细节的查询工作,定位到故障点和故障原因。
【案例】:通过某厂商的专业网管上线告警次数异常的统计,发现AP版本的在线检测时延BUG。
专业性能报表
图10 专业性能报表示例图
网元性能监控和告警统计查询能帮助维护人员在日常维护过程中发现网络设备问题,而专业性能报表(如图10所示)可帮助维护人员在定期例行分析中发现日常检查中未发现的隐性问题,如网络瞬断、数据配置异常、AP负载过高等。
【案例】:通过设备通断明细报表,发现AC的瞬断现象,进而定位到光衰问题,提交到光路传输部门解决。
AP状态的高级查询
图11 AP设备状态的高级查询示例图
利用AP设备状态的各项高级查询功能(如图11所示),不仅可以发现AP数据配置上的错误,还可以用于故障范围的判定、故障设备的查找、故障原因的定位、资料准确性的核查等多个方面。结合承载网网管,使维护人员在大部分故障处理的过程中,不需要到用户侧现场就可以判定故障发生点,将故障处理任务落实到正确的职责部门。
维护策略优化
专业网管维护策略的优化,可以减少网管负载,降低人为隐患,在长期的运维过程中,保障网络的健壮性。
数据提取策略:重要数据适时轮询;次要数据分时段轮询;简单数据按日更新。
周期工作策略:AC数据定时保存、定时备份;数据配置错误周期检查。
即时更新策略:网管主动询问特定数据,即时显示。
接口标准策略:接口标准规范化,网络调整尤其是版本调整不影响后续系统的数据传递。
3. 业务发展阶段的网管设计
WiFi网络的业务发展已呈多元化的趋势,综合网管需要具备业务多元化运营分析决策的能力:
多元网络协同运营分析。WiFi网络可以与多类网络形成协同运营的模式,如无线C网与WiFi网络协同形成C+W业务;校园以太网与WiFi网络协同形成E+W业务;用户内网与WiFi网络协同形成L+W业务;在某些区域还将形成E+C+W等类型业务。综合网管可以将多类网络的运营数据集中进行协同分析,对网络运营、网络建设提出指导性意见。图12以C+W网络协同运营分析图为例,展示了综合网管将C网基站扇区与WiFi网AP热点进行关联分析,指导WiFi网络的工程建设和扩容方向,降低C网Do流量。
图12 C+W网络协同运营分析图
多元业务系统运营。WiFi网络特有的SSID能力可以发展出多元化的业务运营模式,如Chinanet无线WiFi公众业务与重要客户的定制Potral业务构建成WiFi网络中的多SSID分域运营业务;各类WiFi业务分区域、分种类、分时段、分用户计费。综合网管在业务发展阶段可以根据SSID、业务VLAN等字段信息,实现多SSID业务分析、管控;实现分时段资费、分地点资费、分用户资费等业务分析和管控。
多元系统业务支撑。随着WiFi业务的增长,运营商将出现越来越多的业务支撑系统,除了现有的C网网管系统、WiFi网管系统、业务认证系统(如图13所示),未来将拓展到更多系统的对接,包括用户行为分析系统、业务开通系统、用户自助系统、资费管理系统、业务推送系统等。综合网管需要满足多元化的系统接口,提高多元化的支撑能力。
图13 目前的综合网管多系统对接能力图
在业务发展阶段,WiFi网络运维的主要目标是网络优化,全面提升用户感知,优化对象将从早期的AC核心网、承载网转向AP接入网,全面提升AP性能。由于各厂家的WiFi设备技术标准、技术能力不统一,综合网管难以承担网优分析决策的工作,因此这项工作更适合交由专业网管承担。专业网管在网络优化方面能够建立网优分析系统、网优决策系统,具备网络优化可持续可发展的能力(如图14所示)。
网优分析系统:使网优范围跳出用户投诉、实地勘测的局限性,面向全网AP、整体用户。
网优决策系统:使网优方案摆脱个性、典型案例,形成全网可推广、可部署、系统化的网优方案。
可持续可发展能力:建议厂商结合AP改造,不断开发新型、实用的性能参数,形成新的分析决策模型。
图14 专业网管的网优分析、网优决策的系统框架图
三、结束语
综合网管和专业网管的作用,将随着WiFi网络和业务的发展,向不同的方向明显分化。若早期忽视专业网管的建设发展,导致在运维阶段的网络发展受到制约,会影响WiFi业务的顺利运营。因此运营商需要注重网管的双向发展,将难点放在网络发展初期进行解决和控制,构建一个健康的运营级WiFi网络。
打造运营级的WiFi网络,其课题不仅仅在于网管系统平台的设计构建,还包括WiFi网络架构设计、AC运营机制的改造等多个方面。如何将无线和有线结合共同运营,如何将运营级网络的要求向用户端延伸,均需要我们在长期的建设维护工作中不断探索。随着WiFi技术的不断发展,WiFi业务在运营商业务框架中的重要性日益增强,在AC集中化管控、无线网优决策、业务多元化运营等方面还要继续探索新的方法,进一步完善WiFi运营级网络的运维体系。