- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于OLAP商业智能分析方法
基于OLAP商业智能分析方法
摘要:联机分析处理(OLAP),是商业智能的一种分析工具之一。而该文所述的智能分析方法是一种基于OLAP的分析方法,这种分析方法的特征在于采用了MDX(Multi Dimensional Expressions,多维表达语言)语言;使用MDX来处理多维数据的分析;利用MDX快速处理OLAP数据库的能力来实现基于属性度量值的自动报表分析,从而找出对报表总额贡献率最高的几个维度成员组合;通过使用循环遍历多个维度,使用递归技术实现单个维度的上下钻取分析及维度间的连接分析。
关键词:OLAP;商业智能;智能分析方法
中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)17-4199-03
商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。这些数据包括来自企业业务系统的订单、库存、交易账目、客户和供应商等来自企业所处行业和竞争对手的数据以及来自企业所处的其他外部环境中的各种数据。
为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。
目前的数据处理主要分成两大类:联机事务处理OLTP、联机分析处理OLAP。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是维这个概念。
“维”是人们观察客观世界的角度,是一种高层次的类型划分,也叫“维度”。“维”一般包含着层次关系,这种层次关系有时会相当复杂。通过把一个实体的多项重要的属性定义为多个维,使用户能对不同维上的数据进行比较,所比较的数据叫做度量值。因此OLAP也可以说是多维数据分析工具的集合。
OLAP的基本多维分析操作有钻取、切片和切块、以及旋转等。
OLAP有多种实现方法,该文介绍的智能分析方法是其中之一。
1现状
随着信息技术的发展,每天都有海量的数据生成,各种数据之间的高度关联性使得数据分析人员倾向于在多维数据库OLAP里面对数据进行分析。由于已经对原始数据进行了压缩聚合等处理,使得多维数据库无论是在时间还是空间方面的数据存储处理分析能力都比关系数据库优秀。尽管如此,现阶段分析人员对多维数据库的操作只限于简单的查询分析,而且在分析的过程中往往要依赖于分析人员的主观判断,需要分析人员决定分析哪些属性的哪些成员。
现实中的一个问题是假定已知报表总额的某个度量值有所变化,任务是找出对该度量值变化贡献率(贡献率:关于该度量值的一个维度的一个成员占这个维度的所有成员的比重乘以该维度下属成员的数目)最高的几个维度成员。前面已经提到,现阶段分析人员只能对多维数据库进行简单的查询分析且往往包含人为的主观分析。为了完成上述任务,他们的可能做法是手动处理数据立方体的所有输入维度,对每个维度进行查询分析并手动地选择结果并将起返回。这个过程是相当耗费人力和时间的。因此提出一种新的方法自动处理上述问题成为迫切。
基于OLAP的智能分析方法是针对商业智能系统度量值变化贡献率判断问题,特提出的一种方法。
2技术方案原理
如图1,以数据立方体作为输入。对数据立方体的所有维度进行遍历,每次处理一个维度(假定有n个维度)。Di表示维度i,Vijk表示在第i个维度的第j个层次的第k个变量。在第i个维度上,先通过向下钻取提取维度下的第一层成员,然后选取贡献率满足条件(这里的条件是设定的某个阀值)的成员Vi1k并存储这些节点,然后以Vi1k这些成员为基础,向下钻取下一层成员Vi2k,再判断是否满足指定的阀值,假设满足条件的话,则存储Vi2k,并在Vi2k的基础上继续向下钻取。递归的终止条件是在某一层的所有成员的贡献率低于指定阀值。该维度处理完毕,得到的结果是贡献率满足一定阀值的各个维度各个层次各个成员的集合N1。然后存储N1。
第二轮的执行过程为:将集合N1中某个维度i的所有层次的所有成员与其他维度j(Vj≠1)的所有层次所有成员进行链接得到集合N2,里面的成员为Vimn*Vjkl, Vj≠1,且其贡献率要大于给定的阀值。假设N2为空,则算法终止并返回N1的结果。假设N2不为空,先存储N2,再将N2里面的成员进行链接得到N3。N3的行程规则跟N2类似。依次类推,得到一个关于Ni的集
文档评论(0)