第5章数据仓库与数据挖掘的DSS.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 数据仓库与数据挖掘 的决策支持 ;5.1 数据仓库的基本原理;5.1.1 数据仓库的概念;1、数据仓库的概念;1、数据仓库的概念;操作型数据(DB数据)与 分析型数据(DW数据)之间的差别为:;2、数据仓库特点;面向主题;2、数据仓库特点;2.2 集成;应用A 描述 应用B 描述 应用C 描述 应用D 描述 应用A char(10) 应用B dec fixed(9,2) 应用C pic ‘9999999’ 应用D char(12) ;2、数据仓库特点;非易失性;2、数据仓库特点;2.4 随时间变化;2、数据仓库特点;2、数据仓库特点;操作性;2、数据仓库特点;5.1.2 数据仓库中的数据组织;1 粒度;粒度的一个例子; 近期基本数据:是最近时期的业务数据,是数据仓库用户最感兴趣的部分,数据量大。 历史基本数据:近期基本数据随时间的推移,由数据仓库的时间控制机制转为历史基本数据。 轻度综合数据:是从近期基本数据中提取出的,这层数据是按时间段选取,或者按数据属性(attributes)和内容(contents)进行综合。 高度综合数据层:这一层的数据是在轻度综合数据基础上的再一次综合,是一种准决策数据。;2 数据仓库的数据组织结构;3 分割;分割的一个例子;4 数据仓库的数据组织形式;简单堆积文件;轮转综合文件;简化直接文件;连续文件;元数据(Metadata);数据仓库中元数据必须包含的内容; 它是现有的业务系统的数据源的描述信息。这类元数据是是对不同平台上的数据源的物理结构和含义的描述。具体为: ? 数据源中所有物理数据结构,包括所有的数据项及数据类型。 ? 所有数据项的业务定义。 ? 每个数据项更新的频率,以及由谁或那个过程更新的说明。 ? 每个数据项的有效值。; 数据仓库的数据模型是星型模型。 通常企业数据模型被用作建立仓库数据模型的起始点,再对模型加以修改和变换。 ; 这类元数据是数据源与数据仓库数据间的映射。 当数据源中的一个数据项与数据仓库建立了映射关系,就应该记下这些数据项发生的任何变换或变动。即用元数据反映数据仓库中的数据项是从哪个特定的数据源填充的,经过那些转换,变换和加载过程。; 这类元数据是数据仓库中信息的使用情况描述。 数据仓库的用户最关心的是两类元数据: (1)元数据告诉数据仓库中有什么数据,它们从哪里来。即如何按主题查看数据仓库的内容。 (2)元数据提供已有的可重复利用的查询语言信息。如果某个查询能够满足他们的需求,或者与他们的愿望相似,他们就可以再次使用那些查询而不必从头开始编程。 关于数据仓库使用的元数据能帮助用户到数据仓库查询所需要的信息,用于解决企业问题。;5 数据仓库的数据组织模式;星型模式;雪花模式;6 数据追加; 数据仓库工作范围和成本常常是巨大的。开发数据库是代价很高、时间较长的大项目。 提供更紧密集成的数据集市就应运产生。 目前,全世界对数据仓库总投资的一半以上均集中在数据集市上。; 数据集市(Data Marts)是一种更小、更集中的数据仓库,为公司提供分析商业数据的一条廉价途径。 Data Marts是指具有特定应用的数据仓库,主要针对某个应用或者具体部门级的应用,支持用户获得竞争优势或者找到进入新市场的具体解决方案。;独立数据集市(Independent Data Mart) 从属数据集市(Dependent Data Mart);数据源; 1、规模是小的 2、特定的应用 3、面向部门 4、由业务部门定义,设计和开发 5、由业务部门管理和维护 6、快速实现 7、购买较便宜 8、投资快速回收 9、工具集的紧密集成 10、更详细的、预先存在的数据仓库的摘要子集 11、可升级到完整的数据仓库; (1)数据仓库是基于整个企业的数据模型建立的,是面向企业范围内的主题;而数据集市是按照某一特定部门的数据模型建立的; (2)部门的主题与企业的主题之间可能存在关联,可能无关联; (3) 数据集市的数据组织一般采用星型模型,而大型数据仓库的组织采用第三范式。 ;5.2 数据仓库系统;1、数据仓库管理系统;(3)管理部分 它用于管理数据仓库的工作,包括: (1)对数据仓库中数据的维护 (2)把仓库数据送出给分散的仓库服务器或DSS用户 (3)对仓库数据的安全、归档、备份、恢复等处理工作 ;(4)信息目录部件(元数据) 数据仓库的目录数据是元数据,由三部分组成: 技术目录:由定义部件生成,关于数据源、目标、清理规则、变换规则以及数据源和仓库之间

文档评论(0)

职教魏老师 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档