近10年来,中国移动的用户数呈爆炸式增长,其BOSS和经分系统的数据积累已达天文数字,其后台系统之复杂和巨大也毫无悬念地堪称世界之最。那么,除了计费以外,这些丰富的数据资源给我们带来了哪些财富?管理这些数据的成本又占据了多少运营成本?更重要的是,在竞争环境发生变化、电信市场的竞争进入以数字业务或全业务为主要产品的长尾市场竞争时,中国移动这几年建立起来的超级庞大而复杂的支撑系统会成为竞争的核心能力还是包袱?这些问题都应该是一个进入成年期的企业所要考虑的重要内容。因为在信息爆炸时代,能给企业带来价值的数据是宝藏,反之就是垃圾。
计费系统的数据
计费系统从早期的小型计费软件逐渐发展到目前成为电信行业最重要的IT系统,每天承担着巨大的交易量。其发展动力来自两个方面:一是高速用户数增长带来系统处理能力和速度的快速扩容,从普通速度硬盘,到高速内存数据库,可谓对所有市场上的技术无所不用,被称之为“用空间换时间”;二是省级公司与各地市本地需求间的矛盾,集团公司统一营销策划案与各分公司市场部具体地方销售策略之间的矛盾导致计费系统高密度的系统变更,很多省公司计费中心对一星期经历10次以上的上线习以为常,并称之为“用时间换空间(市场空间)”。
系统如此高速扩充,使我们无法顾及整体数据架构和整体应用架构的规划和设计,也没有时间从业务的视角分析计费支撑系统生命之源的业务流程。我们曾经分析,如果一个用户订购了所有的套餐(这是不可能的),那么他一年的计费记录信息也不应超过150kB数据,对于一个拥有1000万用户的运营商来说,10TB的计费数据已经是不小的规模,可实际上目前一般我们都会有50TB以上的数据,甚至100TB。可以想象,数据的冗余、存储的冗余使垃圾数据已经达到了难以控制的局面,凡是有数据处理经验的人都知道,管理这个规模的数据有多么艰难。
经分系统的数据
经分系统一般有4个主要功能:建模分析,寻找聚合数据群并判断市场切分;统计分析,预测结果并回归建模;出统计报表;出KPI指标情况。由于各种原因,中国电信市场的不充分竞争导致经分系统的前两个功能基本没有派上用场,大部分经分系统还是用后两个功能。但经分系统的建设参考了国外的数据结构建设,导致其数据架构不够高效,加上作为数据源的计费系统混乱的数据架构状况,使这方面的问题更加突出。一般意义的数据仓库工具都是为建模分析设计的。每年企业都要拿出大量的资金来扩容经分系统,因为不扩容就无法满足客户增长的需要,而反思其对收入的贡献则实在是无法平衡,导致各省公司在做此类IT投资时苦不堪言。更关键的问题是,如果竞争真的进入白热化,中国移动的竞争利器可能就是经分系统,但长期以来的经分报表化操作可能会使经分系统的数据体系难以支持高频度建模。
分析以上两个方面的原因,我们可以看到这样几个方面的问题。
首先是每到月初和月末的两周,计费和经分系统都会承受出报表的巨大压力,这往往成为每年扩容的惟一依据;第二就是数据似乎永远也无法保证全部正确,即数据的惟一性问题,于是系统就不断重建新数据集,包括内存驻留、临时驻留、短暂驻留等等花样繁出,导致运营商很难看清整体数据体系;第三是计费出报表时与计费功能及详单查询抢资源,经分系统出报表和地市数据查询或其他应用抢资源,经分系统上除了报表KPI以外,功能已经很少,即便如此,经分系统仍旧面临永远的资源短缺。
数据体系改进建议
根据上述计费系统和经分系统的数据情况,笔者对运营商数据体系的改进提出以下4点建议。
1.以业务流程为驱动力,首先分析语音业务、数据业务、固数业务的特点,把实现灵活快速的业务组合作为数据架构调整或优化的最高目标,同时最大限度地保留原有数据体系而进行新的数据架构设计。
2.分别建立交易型(transactionaldatasystem)、分析型(analyticaldata system)和操作型(Operational data system)数据集。但这个过程不可一蹴而就,要持之以恒,并由纵观企业IT全局战略的部门来负责。3个数据系统成型后才可逐渐根据业务的需要和不同数据的历史价值进行数据生命周期的定义。
3.参照SID形成对企业数据体系的全面掌控,包括建立数据字典、数据域间流程的描述、数据变更展示等。根据以往经验,这部分工作有相当大的难度,最主要的难度来自现有的计费系统。以上叙述的原因,导致几乎1/2的数据由中间数据表构成,这部分数据很难根据SID的模型做映射,也没有固定的数据架构和数据属性,从而成了数据黑洞。对这类问题,运营商需要伴随ODS(操作型数据系统)的建立而逐步进行改进。
4.与企业业务流程、系统流程、变更流程同步建立数据变更流程管控平台,形成对数据全生命周期的监控,完全改变现有管控。当我们无法改变现有在线系统时,就需要对它进行监控,并建立完善的变更流程,抑制错误的做法。因此要建立一整套相对完善的数据监控系统,为决策层提供数据生命周期管理、数据变更管理、数据介质使用、数据使用权限管理等方面最直接的依据。
总之,数据、应用和业务流程是电信企业IT建设的3个重大领域,在没有统一IT组织架构的现实情况下,我们从事支撑系统开发和运维的同时,必须实事求是,不能完全推翻过去的IT系统,只能将其改进。从业务流程分析出发,自上而下地提出对数据系统的改进措施是比较现实的做法,特别是参考TMF的SID模型进一步形成企业数据架构。我们要依据全业务经验的业务模型着手设计企业交易型数据系统、分析型数据系统和操作型数据系统,循序渐进地实施,并在企业数据模型设计的过程中考虑数据的生命周期定义。
作者:山西移动IT规划建设中心 陈钢 来源:通信世界周刊