CWM元模型分析研究及其在广发银行数据仓库中的应用.docVIP

CWM元模型分析研究及其在广发银行数据仓库中的应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE / NUMPAGES CWM元模型研究及其在广发银行数据仓库中的应用 李珊珊 一.数据仓库的描述需求 数据仓库是企业级信息管理的一项新兴技术。它的目的是为了将企业的大量历史数据按主题集成在一起,并以一种统一的模式供分析和知识挖掘使用。数据仓库中技术种类繁多,不象数据库系统那样单一,典型的数据仓库技术包括数据抽取技术、OLAP技术、数据挖掘技术等。构建一个数据仓库需要考虑到它的创建、管理、使用和维护等诸多方面,如创建过程中要考虑旧数据库系统的数据模型、数据集成的ETL (Extract, Tansfomation and Load) 规则、仓库中新数据模型的建立等,使用过程要考虑数据的物理模型和展现方式、对数据进行操作的各种统计分析算法、数据挖掘规则等。对于这些应用需求,数据仓库建模应该具备描述它们的能力,无论是底层的数据源信息,还是高层的各种操作信息,方方面面都应尽量涉及到。经过分析研究,发现OMG组织的CWM具备了这种能力,它提供了描述数据源、数据目标、转换、分析、处理、操作等与建设和管理数据仓库相关的元数据基础框架(构成规则集)[1],使不同厂商产品的元数据通信和共享有了一个切实可行的标准。在深入理解CWM的基础上,1.2节总结了CWM的内容框架和各个组成部分的依赖关系。 二、 CWM的内容框架 参考数据仓库的描述需求,课题中对CWM的内容体系进行了总体研究,深入分析了它的组成及结构[23]。CWM基本描述了数据仓库的各个方面,包括基本类型信息、数据资源信息、数据分析信息、仓库管理信息等。当然,它不可能囊括数据仓库中的所有信息,随着数据仓库技术的不断进步,需要描述的新信息也越来越多,这些信息只能被包含进CWM的后续扩展规范中。OMG的CWM工作小组也在时刻关注数据仓库的最新发展动向。目前的CWM版本所包含的信息基本涉及了数据仓库领域的各个方面,虽然不是完全的但至少是描述仓库操作所需的最少信息。另外,对于其所描述的元数据,语义都是精确的、无歧义的。 图1-1是CWM的内容结构图[1],从图中可以看出,CWM的内容按包组织,每个包尽量涉及一个独立的领域,这样极大地方便了开发者的建模工作,因为在建模时只取所需的包即可。并且,包的数目没有太大,结构更易于扩展,CWM目前的版本中包含了18个包和一个ObjectModel,CWM的这种特性也使得它易于理解。每个包都由一系列UML表示的类图组成。虽然这些包描述的领域不尽相同,但它们组织结构并不完全独立,事实上,它们之间有着紧密的依赖关系。在CWM的内容框架中,所有包按功能和抽象层次组织成四层,同层的包的功能角色类似,如第二层中的包描述的都是数据仓库的数据资源。每一层中的包都为同层或上层的包提供服务,如第三层包描述的操作都是基于第二层包描述的数据资源,层次越高描述的内容越抽象。在包的结构方面,或者上层包中的类和关联继承下层包中的类和关联,或者在上层的包直接使用下层包中定义的类或关联,这样做既使整个元模型组织更精练,又使CWM在功能结构上十分清晰。 图1-1 CWM的内容结构图 如图1-1所示,最底层的是ObjectModel,分析CWM的继承图,会发现它是整个CWM的基础。ObjectModel实际是UML的一个子集, CWM最大程度地重用了UML中与描述数据仓库领域相关的一些模型元素[1,7]。CWM所有包的类与关联都是直接或间接地继承ObjectModel中的类与关联,这样,CWM可以看作是从ObjectModel生长出来的一棵大树,树的根部就是ObjectModel。ObjectModel以上的四个层次依次为:Foundation层、 Resource层、 Analysis层、Management层。每个层次中的包都为高层(或同层)的包提供服务。Foundation层的元模型主要是代表上层CWM包共享的概念与结构,如表达式、索引、数据类型、软件配置信息等,虽然这些都是很基本的信息,但它们与ObjectModel中的元素又有所不同,因为这些模型元素专有于CWM领域,而ObjectModel中的元素则更具一般性和通用性。Foundation层中的包以字母顺序给出;Resource层中包含了OLTP系统与数据仓库所使用的各种数据资源,有关系的、层次的、多维的等等,这些数据源都要用到Foundation层的通用信息,如关系包中描述索引和关键字的类都是从Foundation层的Keys and Indexs包中继承而来。此外,ObjectModel恰好是面向对象的数据源,因此,ObjectModel在整个CWM承担着两种角色,一方面作为整个CWM的基础,另一个方面又代表了面向对象数据源;Analysis层提供了数据仓库各种操作的元模型,包括OLAP、数据挖掘、转换等,它们会被映射到

文档评论(0)

ipad0a + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档