无线网络中的数据仓库技术研究(李方伟、李乐民、李忻)
摘要:本文主要介绍数据仓库技术是解决无线网络中的使用报告的性能及灵活性问题的一
种新方法,这种技术从无线网络收集话务数据,并提供使用报告和使用预测。
关键词 数据仓库技术 使用报告 使用预测
1引言
蜂窝移动通信网的快速增长和新业务的不断增加,给运营者带来了更多获取经济效益
的机遇。为了赢得更多的市场份额,运营者有必要全面了解无线网络技术和用户使用情况,
以及自己对市场和系统规划的期望。对网络性能分析和网络规划而言,需要得到用户的使
用模式以及对提供服务质量作出正确决策的准确报告,这些报告必须及时反映蜂窝网络业
务中的市场竞争的变化。为建立一个能够完成上述要求的系统,可采用数据仓库技术。数
据仓库能有向地、稳定地收集数据,以支持管理决策。数据仓库中的数据可以多种方式进
行有效地分割与组合,以便查询、分析和显示信息。
本文介绍的数据仓库系统能从网络上收集业务,并通过一个用户友好的网络界面,以
可操作的方式智能地呈现给终端用户。为一个子网或整个网络上的单个用户或一组用户生
成不同的使用报告,可实现三个指示将来使用趋势的不同预测模型。这些报告和预测可作
为网络容量规划、资源分配、用户使用检测以及用户呼叫方案选择。该系统是解决大量的
快速变化的数据生成使用报告的灵活性和性能问题的一个新解决方法。该系统在作为网络
应用的决策支持平台方面具有重要的潜力。
网络规划和用户市场组建中的优越性是在蜂窝业务中赢得市场份额的关键因素。无线
网络必须适应用户使用模式的变动,这样的网络能为用户提供更多的灵活性和更高的服务
质量,这就是吸引新用户的最好方法。达到这些目标的首要条件是详细地分析系统和用户
使用情况,这也是蜂窝系统分析或市场规划所要做的,需要得到使用报告,以对蜂窝系统
规划、市场及销售预测采取必要的措施。
然而,由于呼叫数据十分庞大、系统结构不断演变以及用户组的变动,使用分析报告
往往不易生成。蜂窝网络是由许多无线站组成的,每个站覆盖的服务区叫做小区。蜂窝电
话通过一个无线信道与基站通信,每个小区只分配有限的信道数。当蜂窝电话从一个基站
移动到另一个基站时,就要切换。如果小区没有了可用的信道,新呼叫或切换呼叫就被阻
塞了。移动交换中心(MSC)每天要处理大约上百万个呼叫。因此,当报告需要收索上百
万条记录时,生成报告的处理速度就相当成问题了。这就促使我们使用数据仓库技术而不
是标准数据库。
2数据仓库系统的组成及其实现方案
数据仓库系统由数据处理器、数据仓库和网络报表服务器三个主要部分组成。数据处
理器从MSC接收自动信息统计(AMA)记录并完成解压、传输和装载。AMA数据包括:电话
号码、日期、小区、切换等。这些集中起来的数据被装载到已填充的主真值表的数据库里。
网络报表服务器查询数据仓库,然后把使用报告发给浏览器。为了防止数据仓库过载,应
把数据仓库从网络报表服务器中分隔出来。另外,由于这使得不同应用可用不同方法查询
相同数据库,故这种结构很容易升级,以适应多种网络报表服务器。
数据仓库系统可以采用标准的星型结构来实现。它包括一个主真值表(“使用方法”
表)和几个元素表。“使用方法”表能容纳不同时刻收集的使用情况。
数据处理器主要处理数据解压、传输和装载。解压的过程首先是把原始的二进制数据
解为可读的文本数据。这个过程的输出只是一些个人呼叫记录,诸如,电话号码、起始呼
叫时间、终止呼叫时间翩始小区和信道、终结小区和信道前无切换、呼入和呼出、被叫号
码、呼叫持续时间以及其它信息。每个MSC每天输出数据大小在50-150MB之间。
装载过程首先检查可能在先前处理过程中已出现的潜在错误。结合当前关键字的检查,
就可确保关键字的每个值是唯一的。如发现新的小区,那么就更新该小区的元素表,然后
把已排列的数据装入数据仓库。同时,装载过程从“使用方法”表或直接从呼叫记录计算
特定应用收集表,并把它们装入数据仓库。
数据仓库的清除和保存是通过使用“使用方法”表来完成的。每天都进行数据装入,
而按周清除数据仓库数据。最早期的数据在每周末保存,由于需清除数据的量很大,按区
域把“使用方法”表分割开,使得每个分割保持一周的数据。
3使用报告与分析
数据仓库系统中,设计用户界面的的基本原理是:要求必须具有友好的用户界面,一
致的外观,在整个系统中以同样的方式操作,以减少终端用户的学习时间。界面设计的主
要目标之一是为终端用户提供一个灵活的方法,使其能访问所有期望访问的数据,但又必
须使界面尽可能简单。
使用报告可分为以下三类:
(1)个人使用:计算单用户的使用模式。
(2)群和区域使用:计算在网络的子集上动态定义的用户群的使用模式。
(3)系统使用:计算整个系统的业务模式。
3.1个人使用报告
数据仓库系统根据结出的用户号和时间段,生成显示呼叫的平均持续时间,收集时段
内使用时间以及以小时计算和以天计算的呼叫号码的报告,并且这些报告都是用图表表示
的。数据仓库系统可用这种呼叫功能来表示一个减少用户每月费用的呼叫方案。
数据仓库系统也能生成按特定时间收集的呼叫小区用户的使用报告,这些报告可显示
用户的踪迹或位置。更重要的是,它为确定该用户在不同的时间段是否忙闲提供了一个线
索。数据仓库系统可用这些信息来引进一个有效利用增进资源的呼叫方案。
另外,数据仓库系统也能找到呼叫的平均持续时间、时段内的使用时间或者在时段内
的失败呼叫的号码。这些呼叫可分为长途呼叫和局域呼叫,这类报告提供了可用于市场规
划的“家区”信息。
3.2群与区域使用报告
为了生成群和区域使用报告,用户必须选择使用预定义的群和区域。对群使用报告,
数据仓库系统可以:(1)以使用分钟数形式显示由选定组生成的每个小区/微区的最忙时
业务量,也显示最忙小时和摘要信息;(2)显示每个群的呼叫号码,使用分钟数,呼出
分钟数,呼入分钟数,计时分钟数以及非计时分钟数。也就是说,群的使用报告显示群在
分配小区内的使用或在时段内使用分钟数的使用类型。群的使用用户有:预付费用户和高
使用率用户。
区域使用报告可显示在选定时段内每个区域的使用分钟数总和。区域使用报告允许分
析任何指定区的业务量。数据仓库系统也提供群与区域的合成使用报告,以便研究由选定
区域的指定群产生的系统业务量。例如,我们可以研究在指定区域的局域用户与漫游用户
间的系统资源冲突。
3.3系统使用报告
系统使用报告可显示整个系统的全部示意图表,包括总计使用报告——显示每小区/
微区合计使用;长话使用报告——显示每个中继群的呼出与呼入使用分钟数;前缀使用报
告——计算用户定义的每个前缀的使用(例如,具有800号的话务量就可通过定义一个800
前缀而轻易得到,在极端情况,前缀可以是电话号码本身。);系统峰值使用报告——显
示系统范围的最忙时间和话务量,这提供了对网络资源的上界要求。
4使用预测与方案选择
数据仓库系统除了提供不同级的使用报告外,它还可通过基于过去的使用情况来预测
以后的使用,这有助于网络规划。基于用户呼叫模式和网络资源,它弓队最佳的呼叫方案,
这也有助于网络的优化。
4.1使用预测
数据仓库系统提供了两类使用预测报告,即“总话务量预测报告’与“群话务量预测
报告”。二者的区别是,后者预测指定群的使用。若结定一个小区,预测报告就会生成当
前时间段已存在的话务量与下一时间段的预测话务量的图表。用户以天数定义一个时间段,
可使用时间段内的峰值话务量或者平均话务量模型。另外,终端用户可选择一种预测方法:
线形回归法(指数平均或者移动平均)。当预测到小区的话务量在增长时,则需采取措施
扩大容量,如增加新的通信信道以满足需要。
4.2方案选择
利用个人使用报告提供的数据和业务量预测方案,可为蜂窝用户设计一个呼叫方案选
择应用算法。若结出用户电话号码和时间段,这种应用算法基于用户在时间段内的预计速
率和使用模式,可在不同成本方案中选择最低成本的方案。
另外,可用两种方法进一步扩充该应用算法。首先,用户呼叫方案的选择可基于过去
使用模式或者预测的使用模式(用线形回归方法),各方案的成本预测时段可为一周或一
月,扩充用户使用特征来计算具有最低成本的呼叫方案,如果用户的使用有某种趋势(如
上升或下降),那么这种扩充可选择一个不同于过去使用的方案。
第二个扩充是提高选择的性能。最低成本方案选择方法对用户不一定总是最好的,每
个小区的信道数是有限的,如果在同一时刻太多的用户使用同一信道,那么很多呼叫就可
能被阻塞,从而会引起用户不满。故一个好的推荐方案应该是符合可用资源的最低成本呼
叫方案,改进的选择性能考虑到了每个小区的使用特征和阻塞概率。使用该改进的选择性
能,每种方案的总体成本是用作为金融成本与对给定方案在相关时间段的阻塞率的线形函
数来计算的,这样就可选出最低成本方案了。
5结论
本文描述了基于网络的数据仓库系统,通过使用数据仓库技术,有效地满足了网络的
性能和灵活性的要求。可提供不同类型的使用报告,它们可用于基本报告生成、动态建模、
用户文档生成和使用预测。作为数据库的另一个应用,通过一个二维的生灭过程可以确定
蜂窝网络的阻塞概率,基于方案成本和网络资源的可用性,可设计用于用户呼叫方案选择
的应用程序。数据仓库技术可应用于需要分析大量的报警数据的网络操作中。也可以把数
据仓库技术应用到网络性能管理中去。
摘自《电信科学》
无线网络中的数据仓库技术研究发布: 2010-10-20 00:52 | 作者: | 来源: | 字体: 小 中 大
相关专题:
无线
扫码关注5G通信官方公众号,免费领取以下5G精品资料
|
本周热点本月热点
最热通信招聘业界最新资讯
最新招聘信息最新技术文章最新论坛贴子 |