数据仓库与数据挖掘原理及应用(第二版)教学课件 作者 王丽珍 周丽华 陈红梅 第13章.pptVIP

数据仓库与数据挖掘原理及应用(第二版)教学课件 作者 王丽珍 周丽华 陈红梅 第13章.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库与数据挖掘原理及应用(第二版)教学课件 作者 王丽珍 周丽华 陈红梅 第13章

在线教务辅导网:;第十三章 企业数据仓库系统构建 ;第十三章 目录; 伴随信息技术的迅速发展和企业管理决策支持的需要,数据仓库技术在近年来有了飞速的发展。已经从纯理论研究转化为决策支持领域中的一种实用性极强的技术。在企业中,随着信息管理的完善,积累了丰富的产、销、存及财务等一系列的管理数据,急待构建公司(集团)级数据仓库以用于支持分析、决策。 本章主要结合某企业构建基于SAP NetWeaver平台的先进的企业商业智能系统项目,展现一个EDW(企业数据仓库)构架的企业数据仓库的建设。; 13.1 系统介绍;13.1.1 系统建设的背景; ERP的成功实施和应用,在使企业流程规范化的同时,也使得企业管理系统能处理的数据量呈指数性增长。对企业管理者来说,相当程度上,企业管理就是“信息的管理”,大量准确、及时的数据信息库无疑就像一座高品位的金矿一??,会让其兴奋不已。如何开采和利用这些“金矿”无疑就成为了急待解决的问题。; 13.1 系统介绍;13.1.2 系统定位和总体结构; 如图13.1所示,系统总体结构以目前企业中运行的SAP R/3系统和其他业务系统为基础,将SAP R/3系统和其他业务系统作为数据仓库的数据源提取数据,数据在数据仓库中根据规则层层上载并根据需要加工、处理、合并,最终将数据存放在Cube中,基于Cube设计报表,在企业门户中进行展示和分析。;图13.1 系统总体结构;1. EDW建模特点 ;图13.2 SAP BI标准EDW模型; 如图13.2所示,EDW的建模思想将数据仓库区分为三个层次: (1)Extract Layer(数据提取层) SAP BW将数据仓库的数据源分为两种:SAP数据源和Non-SAP数据源。SAP BW和的组件完全集成,将各组件的数据源由预定义的提取机构及程序传输到BW的数据提取层。对于Non-SAP的数据源,BW有开放的构架,通过BAPI接口传输数据。 提取层的数据保留了来自源系统的原始数据,存储在二维的表中,以便于下一步的数据清洗、转换和整合。其优点是:一次抽取到BW后,如果需求有所变动,不需要重复去源系统中提取相关数据,而直接在BW中处理,提高数据仓库的提取效率,降低对源系统的资源占用。 (2)Integration Layer(数据合并层) 将提取层的原始数据进行清洗和整合,其实质就是建立数据源之间的关联,把有用的相关数据统一放在二维表中,例如:把FI和CO的数据源整合到一个表中,以便于下一层建模的使用。数据合并层能够将提取层的原始数据自由组合,满足多变的业务需求。 ; (3)DataMart Layer(数据集市层) 最终的报表将在这层模型上建立,所以,该层将使用星形数据模型(SAP BW中称之为InfoCube)创建不同的分析维度,提高查询的效率。 数据上载的流程从源系统到数据提取层,由数据合并层清洗、整合后传输到数据集市层建立多维模型。EDW建模思想的优势在于:将未来企业可能发生的业务变化,用三个层面的模型灵活处理。例如:当企业组织构架变化,即主数据发生变化后,BW可以在数据合并层应对主数据的变化。 ; 优点: ; 缺点: ;第十二章 企业数据仓库系统构建;13.2 系统分析与设计; 13.2 系统分析与设计;13.2.1 系统需求分析;以生产模块(主题)为例,通过调研、交流和分析得到: 关键分析指标: 1)量(产量、计划产量、交库数、入库数量、出库数量、库存数量); 2)率(计划完成率、成材率等)。 主要分析维度: 1)组织维度:公司 、工厂 、库存地、车间; 2)物料维度:大类、中类、小类、细分类、产品组、牌 号、物料组、生产调度员; 3)时间维度:年月、年月日、年、季、周。 主要分析方法: 1)比较分析(同比、环比); 2)趋势分析;;3)比例分析。 最终将企业生产模块的主题分为两大类:一类是经营决策类,另一类是日常管理。列出需要在本期项目组组织开发的主题清单。 在需求调研过程中,发现有部分报表的数据不能直接从目前的ERP系统中取得,需要从外部手工导入,或者需要在ERP系统规范业务操作、完善业务流程处理后才能获得,还有部分数据获取比较困难,例如钢材成材率,需要从已知的成品反查钢坯重量并计算才能得出,但在系统中反查钢坯信息非常困难,会导致系统性能大幅下降。; 2. 详细分析 在概要分析的基础上,初步确定数据仓库最终的主题及报表展现格式。并分解各主题(报表)指标,梳理数据逻辑关系,包括确定与SAP R/3系统相应字段的关联。例如表13.1中“生产调度员”字段,因为业务不同,在SAP R/3中很多数据库表都包含了该字段,而且字段名称和描述可能不一致,需要将该字段与SAP R/3数据库表M

您可能关注的文档

文档评论(0)

dajia1qi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档