- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
作业 4 理解数据仓库的数据组织要求和方法 掌握数据仓库的星型模型、雪化模型的设计方法 理解元数据的类型及其作用 数据仓库与数据挖掘 内容提要 数据模型 元数据 数据的粒度 数据模型 传统数据库数据模型 数据仓库的数据模型不同于数据库的数据模型在于 数据仓库只为决策分析用,数据仓库的增加了时间属性数据。 数据仓库增加了一些综合数据。 数据仓库的数据建模是适应决策用户使用的逻辑数据模型。 数据仓库概念模型 1.数据仓库模型的概念 数据仓库概念模型的设计需要给出一个数据仓库的粗略蓝本,以此为工具来确认数据仓库的设计者是否已经正确的了解数据仓库最终用户的信息需求。 (1)概念数据模型 在构建数据仓库的概念模型时,可以采用在业务数据处理系统中经常应用的企业数据模型——ER图。这是一种描述组织业务概况的蓝图,包括整个组织系统中各个部门的业务处理及其业务处理数据。 数据仓库与操作型数据库一样,也存在高层模型(ERD,实体关系层)、中层模型(DIS,逻辑层)和低层模型(物理层)3个层次数据模型。 企业数据模型(举例) 数据仓库的数据模型 数据仓库存储采用多维数据模型。 星型数据模型 大多数的数据仓库都采用“星型模型”。星型模型是由“事实表”(大表)及多个“维表”(小表)所组成。 “事实表”中存放大量关于企业的事实数据(数量数据)。 例如:多个时期的数据可能会出现在同一个“事实表”中。“维表”中存放描述性数据,维表是围绕事实表建立的较小的表。 星型模型 模型的核心是事实表,维表通过主键与事实表和其他维表链接 事实表中的数据不允许修改,新数据只是简单的增加 非规范化程度高,如不同时期的同类数据可能出现在同一维表中,数据冗余大 存取速度快,以增加空间换取较快的访问速度 难于适应业务需求的变化 雪花数据模型 雪花模型是对星型模型的维表进一步层次化,原来的各维表可能被扩展为小的事实表,形成一些局部的“层次”区域 在上面星型模型的数据中 ,对“产品表”“日期表”“地区表”进行扩展形成雪花模型数据见下图。 雪花模型举例 星网模型 星网模型是将多个星型模型连接起来形成网状结构。多个星型模型通过相同的维,如时间维,连接多个事实表。 数据仓库的逻辑模型与物理模型 数据仓库(中间层)逻辑模型 中间层数据模型亦可称为逻辑模型,它是对高层数据概念模型的细分,在高层数据模型中所标识的每个主题域或指标实体都需要与一个逻辑模型相对应。 物理数据模型 是依据中间层的逻辑数据模型而创建的,它通过确定模型的键码属性和模型的物理特性,扩展中间层数据模型而建立。此时,物理数据模型就由一系列表所构成,其中最主要的是事实表模型和维表模型。 物理模型中的事实表来源于逻辑模型,它依据数据仓库具体的应用而建立。事实表是星型模型结构的核心。 维模型 维度表模型也需要根据逻辑模型设计,在设计过程中考虑维度表模型是用户分析数据的窗口。维度表应该含有商业项目的文字描述,维度的设计提供了维度属性的定义。这些属性应具有这样一些特征: A.可用文字描述。 B.离散值。 C.有规定的限制。 D.在分析过程中可以提供行标题。 元数据及其作用 1.元数据的定义 元数据在数据仓库的设计、运行中有着重要的作用,它表述了数据仓库中的各对象,遍及数据仓库的所有方面,是数据仓库中所有管理、操作、数据的数据,是整个数据仓库的核心。 元数据是关于数据、操纵数据的进程和应用程序的结构和意义的描述信息,其主要目标是提供数据资源的全面指南。其范围可以是某个特别的数据库管理系统中从现实世界的概念上的一般概括,到详细的物理说明。 在数据库中,元数据是对数据库中各个对象的描述。关系数据库中,这种描述就是对表、列、数据库和其他对象的定义。 从广义上讲,元数据代表定义数据仓库的任何对象, 无论它是一个表、一个列、一个查询、一个业务规则,或者是数据仓库内部的数据转移等等。 元数据举例 举例:全国文化信息资源共享工程中的元数据 疾病 描述: 显示器件: 缩写: ILLNE名字空间URI: /ndcnc/elements/ILLNE 附属标记: 20030729135551 疾病名称 疾病分类 疾病简介 症状 病因及发病机制 病理变化 诊断 治疗 举例:全国文化信息资源共享工程中的元数据 举例:全国文化信息资源共享工程中的元数据 描述: 显示器件: 缩写: WEAPO 名字空间URI: /ndcnc/elements/WEAPO 附属标记: 20030729135519 兵器名称 研制国别 研制机构 研制时间 分类 关键词 简介 图片 视频 音频 相关书目 元数据的作用 (1) 元数据是进行数据集成所必需的 (2) 元数据定义的语义层可以帮助最终用户理解数
文档评论(0)