- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
商业智能数据仓库核心篇sybase产品介绍
Warehouse Studio
Warehouse Studio是Sybase为其建树性数据仓库平台起的名字,它用来进行数据仓库设计、多数据源集成、以简便的方式实现数据管理、数据的具体化和管理整个环境。Sybase数据仓库方案可以拓展成为某个指定应用需求服务,这样的一些附加性能将在下文中加以描述。
图四:Sybase数据仓库产品包可用于建立数据仓库和数据集市
经过不断的努力,Sybase已经拥有了一个数据仓库建立方法,既可以支持数据集市又可以支持集中式数据仓库的建立。Sybase的Adaptive Server数据库管理系统其关键的保证组件,表现为一个称为Adaptive Server IQ的高性能决策支持优化数据库,一个称为企业级Adaptive Server的企业级联合数据库以及对已有DBMS进行集成的连接组件。
对这些数据库的集成以及对元数据的高度集成和管理是Sybase能有效地支持数据集市和集中式数据仓库建立的主要原因,这种建立可以快速地实现,花费也是有效的。Sybase的另一个重大成果是它将一系列简单易用、强大和自动化支持工具进行集成,减轻了系统集成难度,加快了实现过程。
Sybase的数据仓库建立方法是由业务应用逆向进行,从数据集市开始建立企业体系结构。在开始时,为了使企业的需要与那些已建立有效数据集市的单个部门保持一致,Sybase提供了一个体系框架和一套自动化产品集。与大多数数据仓库供应商比较起来,Sybase的数据集市方法、支持技术和方法能够提供更大的灵活性、可扩展能力、高性能和有效成本。在不牺牲各自利益的前提下,它可以帮助你避免因每个部门建立一个分离的数据集市而带来的混乱。
这种方法的基础是贯穿于数据集市开发进程中的元数据的采集和提炼。因而,使用了Sybase后,你可以建立独立的数据集市,具有一个共同的基础逻辑数据模型,在当前或将来允许你构筑一个多层的数据仓库环境。在这一体系结构中,一个中央数据仓库建立功能函数被作为一层置于所有数据集市之上,支持它们的共同需求。例如,中央层将作为一个从数据源中进行数据抽取和数据转换的共同位置。在这个方案中,你可以将一套非依赖性数据集市重构为从一个共用数据仓库获得信息的依赖性数据集市系统。
下面将介绍Warehouse Studio提供的建立和完成数据仓库的功能和附加工具产品。
设计和建模
WarehouseArchitect
在任何一个企业体系中,关键的是要定义可在应用之间进行共享的数据元素。每个数据集市都需要尽可能迅速地建立起来,以适应单个应用需求,然而,IT部门必须具有一种企业级的眼光和拥有一个可扩展的元数据模型。
对于数据仓库数据设计来说,PowerDesigner WarehouseArchitect是个高度优化的数据库工具,广泛用于数据源的逆向工程、建模、数据仓库方案设计,以适应每个业务需求。通过对逻辑设计、物理设计和应用建模进行集成,WarehouseArchitect方便了数据仓库的开发和实现。
利用WarehouseArchitect,数据集市或数据仓库设计者可以自动地对产品数据库进行逆向工程,建立目标数据库设计、物理设计和DDL。它能够支持包括星形模式、标准/非标准化ER图和聚集等级模式在内的所有业务模式,Wizards工具可以帮助数据库设计者对一个模式进行创建或修改,以最好地适于业务需求或业务模型。一旦产生了一个数据库,数据仓库体系可以直接从数据库设计生成数据仓库应用,或者使用一种流行的的分析系统,或者通过生成Web页模板。这些都可以在单一WIN95图形环境中实现。
所有的设计、DDL和元数据都被存放在中央数据仓库里。这使得IT部门可以对设计进行不断修改,对先前的模式数据库进行重用和重构。一个效果分析模块被用来帮助开发者在数据集市中识别共用数据元素,以保障企业数据集市体系的坚固一致性。
数据集成
在进行数据仓库或数据集市的建立时,最大的挑战之一是如何将原始业务数据转化为一致的格式,使之更好地为决策支持服务。这包括对已有数据的准确性和一致性进行检验、净化,将数据进行转化、提取、转换、装载到数据集市或数据仓库以及对其进行定期更新和管理。
由于这一工作的复杂性,适于这些任务的许多可用工具成本花费又高,又需要相当的专业技术。因为你可能会用到几个既没有很好地集成又不是图形化的工具。这些工具在培训和咨询服务方面的投资成本对于一个小小的数据集市项目而言是过分昂贵的。
另一个途径是建立你自己的工具。这对于转换和抽取需求相对简单的情况来说可能足够用了,而当需求变得复杂时就会显得效率低下。当数据集市的规模激烈增长时,越来越多的数据源需要被访问并维持一致性,越来越多的复杂转换需要在数据上进行处理。
S
文档评论(0)