- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章数据仓库开发模型 在创建数据仓库之时,需要使用各种数据模型对数据仓库进行描述。数据仓库的开发人员依据这些数据模型,才能开发出一个满足用户需求的数据仓库。使开发人员能够将注意力集中在数据仓库开发的主要部分。模型有更好的适应性,更易于修改。当用户的需求改变时,仅对模型做出相应的变化就能反映这个改变。 数据仓库开发模型 2.1数据仓库开发模型 2.2数据仓库概念模型 2.3数据仓库逻辑模型 2.4数据仓库的物理模型 2.5数据仓库的元数据模型 2.6数据仓库的粒度和聚集模型 练 习 2.1 数据仓库开发模型 模型是对现实世界进行抽象的工具。在信息管理中需要将现实世界的事物及其有关特征转换为信息世界的数据才能对信息进行处理与管理,这就需要依靠数据模型作为这种转换的桥梁。这种转换一般需要经历从现实到概念模型,从概念模型到逻辑模型,从逻辑模型到物理模型的转换过程。 现实世界 概念世界 逻辑世界 计算机世界 信用 特性 属性 列(字段、数据项) 张三 个体 实体 记录 客户 整体 同质总体 表文件 客户与产品 整体间联系 异质总体 数据库 数据仓库的设计就是在概念模型、逻辑模型和物理模型的依次转换过程中实现的。作为数据仓库的灵魂——元数据模型则自始至终伴随着数据仓库的开发、实施与使用。数据粒度和聚集模型也在数据仓库的创建中发挥着指导的作用,指导着数据仓库的具体实现。 现实世界 概念模型 逻辑模型 物理模型 数据仓库 元数据模型 数据粒度和聚集模型 2.2 数据仓库概念模型 2.2.1 概念数据模型 财务部门 销售收入账 应收账 应付账 成本账 销售部门 销售计划 销售合同 销售统计 人事部门 员工业绩记录 员工技能情况 员工薪酬表 企业数据模型 销售部门 人事部门 财务部门 … …… …… 图2.3 企业数据模型 数据仓库的数据模型中不包含操作型的数据,数据仓库的数据模型只包含用户所感兴趣的分析数据、描述数据和细节数据。 数据仓库的数据模型扩充了关键字结构,增加了时间属性作为关键字的一部分 数据仓库的数据模型中还增加了一些由基本数据所导出的衍生数据,这些导出的衍生数据主要用于对企业的管理决策进行分析 指标实体(事实实体) 指标实体名 维度实体名 详细类别实体名 维度实体 详细类别实体(引用实体) 2.2.2 规范的数据模型 第一范式、第二范式、第三范式数据仓库的反规范化处理 数据仓库的数据 普通数据库系统的数据 长期的框架 静态 数据通常是汇总的 特殊查询访问 定期更新 数据驱动 短期的框架 快速变化 记录级的访问 标准查询访问 实时更新 事件驱动 2.2.3 星型模型 星型模型是最常用的数据仓库设计结构的实现模式。使数据仓库形成了一个集成系统,为用户提供分析服务对象。 事实表 维度表 维度表 维度表 维度表 维度表 核心是事实表,围绕事实表的是维度表。通过事实表将各种不同的维度表连接起来,各个维度表都连接到中央事实表。 2.2.4 雪花模型 雪花模型是对星型模型的扩展,每一个维度都可以向外连接到多个详细类别表。 雪花模型对星型模型的维度表进一步标准化,对星型模型中的维度表进行了规范化处理。 事实表 维度表 维度表 维度表 维度表 维度表 详细类别表 详细类别表 2.3 数据仓库逻辑模型 信息反馈 贵宾卡 账号 姓名 客户类型 初次交易时间 账号 省 市 县 街道 邮政编码 账号 现金交易额 信用交易额 账号 商品编号 时间 交易量 账号 最大信用额 最近信用发 生时间 账号 记录人 反馈类型 反馈时间 账号 服务种类 时间 服务费用 颜色 信用交易 客户编号 交易记录 信用状况 商品交易 服务交易 签字 现金交易 账号 交易额 信用额 信用时间 2.3.1 事实表模型设计 1.事实表 (1)客户事实表 客户基本情况表(账号Integer9,姓名Character12,出生地Character20,初次交易时间Date,……)。 2.事实表中的事实特性 事实表中一般包含两部分,一是由主键和外键所组成的键部分,另一是用户希望在数据仓库中所了解的数值指标。 派生事实主要有两种,一是可以用同一事实表中其他事实计算得到,还有一类派生事实是非加法性事实。 2.3.2 维模型设计 客户主题维度表模型 时间维度表(年Date,月Date,日Date)。 地点维度表(省Character20,市Character20,县Character20,街道
我们是专业写作机构,多年写作经验,专业代写撰写文章、演讲稿、文稿、文案、申请书、简历、协议、ppt、汇报、报告、方案、策划、征文、心得、工作总结代写代改写作服务。可行性研究报告,实施方案,商业计划书,社会稳定风险评估报告,社会稳定风险分析报告,成果鉴定,项目建议书,申请报告,技术报告,初步设计评估报告,可行性研究评估报告,资金申请报告,实施方案评估报告
文档评论(0)