- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本文收录于电信科学2003年11期
基于数据仓库和维度转换技术的广东电信公话200专用话机话务动态分析系统
马根峰
(广东电信公用电话管理中心 广州 510635)
摘要 在电信市场尤其是公话市场竞争激烈的今天,广东电信公话中心的有关经营分析人员比较迫切的想进行一百多万部200专用话机话务的动态分析,但目前话机资料及细节级话务数据分散于操作型数据环境的组织方式确不能提供这样的支撑,所以必须对数据进行重新组织,并且要按照不同的分析需要对数据按照不同的综合程度来组织。不仅如此,话务的动态分析还要求对话机资料进行更新、对话务表按照时间维度进行转换,通常的OLAP分析工具在对几十万条记录的数据表进行维度转换时效率就极为低下。在这种前提下笔者编写了”话务动态分析系统”,利用数据仓库技术对操作型环境中的数据进行挖掘、按照不同的粒度来组织;在数据仓库设计时兼顾动态分析的需要,在数据仓库数据生成时自已编写程序实现话务按照时间维度转换,轻松地实现了话务的动态分析。
关键词 数据仓库;OLAP;维度;分布式数据库访问技术;事务
1 引言
200业务是广东电信的一项重要业务,因而对于众多200专用话机的话务分析显得非常必要。即电信经营分析人员不但要能从较高层面上分析全省或部分地区、所有或部分用户类型话机、某些地区某些用户类型话机及某些市县、支局的某些用户类型的话机话务在某些时间段的变化,而且要能从细节上跟踪每一部200专用话机话务在不同时期的变化。从而了解200专用话机话务变化的原因或找出其中的规律,为管理者决策提供依据。但目前只能分析层面比较高的地区级话务的变化以及某一计费月200专用话机的话务情况,经营分析人员即使知道了全省或部分地区的话务变化,却不能找出其中的原因或规律。这是因为200业务的数据分散于操作型环境之中,并且都是细节性的数据(如每个月的200话务表fee_200_yymm、200专用话机资料表G200_yymm,yymm表示年月)。在这种操作型的环境中要想进行”先高层后低层”的话务动态分析,即按照地区→市县→支局→话机的层次,结合200专用话机的用户类型来一级一级地找出200话费变化原因或规律,显然是不现实的 。
要想解决上面的问题,就必须建立一个分析型的数据环境。首先利用数据仓库技术对话机资料数据及话务数据重新组织,并且按照不同的细节程度来设置不同的粒度,形成一个综合的、面向分析的环境,然后利用OLAP工具(如Brio)去掉各粒度表中的时间维度,来满足不同层次上话务动态分析目标的需要。
但这些OLAP工具通常用于处理记录较少的表的维度转换,对于处理电信运营商中存在的每个月都是几十万、几百万乃至几千万条记录的表的维度转换时从执行时间上讲是不可行的(在处理百万级数据表的维度转换时运行几百个小时也得不到结果),所以笔者首先利用数据仓库技术将数据进行挖掘,在数据仓库设计时兼顾动态分析的需要,在数据生成时自已编写程序实现维度转换,然后基于维度转换后的数据表来生成不同粒度的综合级表。最终在PC机上仅用了一个小时就完成了一百多万部200专用话机资料的更新及近一百万条记录话费表的处理并生成了数据仓库中的不同粒度的数据,从而轻松地实现了话务的动态分析。
2 数据仓库与OLAP
2.1 数据仓库的特点
数据仓库技术是用以更好地支持企业或组织的决策分析处理的,面向主题的,集成的,不可更新的、随时间不断变化的数据集合。它通过将数据按照不同的综合程度(即粒度)来组织,以满足不同分析的需要。
2.2 联机分析处理OLAP
OLAP是针对特定问题的联机数据访问与分析。通过对信息(这里的信息已经从原始的数据进行了转换,以反映用户所能理解的企业的真实的”维”)的很多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。
维是OLAP中的一个基本概念,它反映了人们观察数据的特定角度,如电信业务分析中从不同的计费月来观察话机的话务,这里的时间(计费月)就是一个维。
一个维往往具有多个层次,如时间维可以从日期、月份、季度、年等不同的层次来描述。但在广东电信公话管理中心,对200专用话机话务的动态话务分析主要从月份这个层次来进行。
2.3 数据仓库中的星型模式
2.3.1 数据仓库中的星型模式
星型模式是用关系数据库系统来实现的数据仓库中最常见的模式,在这种模式下,数据仓库由事实表和维表构成。事实表中包含着用于分析的指标和链接维表的主键。如下面细节级话机话务和话机资料的关系模式
话机话务(电话号码,时间代码,话费)
话机(电话号码, 地区代码,市县代码,支局代码,用户类型代码,话机安装地址,…)
地区(地区代码,地区名,市县代码,市县名,支局代码,支局名)
用户类型(用户类型代码,用户类型)
时间(时间代
文档评论(0)