数据仓库习题答案的.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库习题答案的

第一章 1.为什么不能依靠传统的业务处理系统进行决策分析? (P1-3) 2.在将数据源中的数据加载到数据仓库之前需要完成那些工作?为什么要进行这些工作?(数据准备P13-14 另外加“抽取” ) 3.(选做)如果创建一个数据仓库,主要是分析关于客户的人口统计(收入、家庭人口、家庭位置、爱好等)。数据仓库的目的在于将特定的产品推销给合适的潜在客户群。这个数据仓库应该从哪些地方获取数据源,数据仓库的体系结构应该包含哪些部分。(P12, 8) 4.从数据挖掘与数据库、统计学、机器学习的关系来讨论什么是数据挖掘? 5.在数据挖掘过程中需要涉及到哪些过程?(P31-35) (1). 确定对象   清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步.2)数据准备1) 数据的选择选择出适用于数据挖掘应用的数据.2) 数据的预处理研究数据的质量, 并确定将要进行的挖掘操作的类型.3) 模型的一个分析模型.这个分析模型是针对挖掘算法建立的数据挖掘对所得到的经过转换的数据进行挖掘.结果分析解释并评估结果.其使用的分析方法一般应作数据挖掘操作而定,通常会用到可视化技术.   知识的将分析所得到的知识集成到业务信息系统的组织结构中去, 维 :关于一个组织想要记录的透视或实体。 维表 :对维各个属性的描述。 事实 :数值的度量。 事实表: 包括事实的名称或度量,以及每个相关维表的关键字。 元数据: 数据的数据,可以对数据仓库中的各种数据进行详细的描述与说明,说明每个数据的上下关系,使每个数据具有符合现实的真实含义,使用户可以了解这些数据之间的关系. 粒度 :数据仓库中数据单元的详细程度和级别. 星型模型 : 最常用的数据仓库设计结构的实现模式。使数据仓库形成了一个集成系统,为用户提供分析服务对象。核心是事实表,围绕事实表的是维度表。通过事实表将各种不同的维度表连接起来,各个维度表都连接到中央事实表。  雪花模型: 对星型模型的冗余的维度表进一步分解,对星型模型中的维度表进行了规范化处理。 问答: 1.简述olap 与oltp的区别; Olap:在线分析处理;oltp:联机事务处理。 2.在一般的信息管理中采用哪些概念模型来描述信息处理的对象,这些概念数据模型是否适合数据仓库的开发环境? 略答:一般的业务处理系统中广泛采用实体-关系模型(ERD)来描述信息处理的对象,但 它无法表述数据仓库中所需要的分析数据、描述数据和细节数据之间的关系,无法反映出时间属性的存在和作用,更无法表现出数据的导出关系,因要对其进行修改,得到星型模型或雪花模型。 (CRUD矩阵在数据仓库的高层模型中反应实体的生成、引用、更新和删除不属于概念模型的范畴) 3.航空公司希望能够分析在其服务旅客中的常客旅行趋势,这样可以为公司正确定位航空市场中的常客市场。并且希望能够跟踪不同航线上旅客的季节变化情况和增长,并跟踪在不同航班上所消费的食品和饮料情况,这样可以帮助航空公司安排不同航线上的航班和食品供应。现在所面对的任务是为其设计一个数据仓库的概念模型、逻辑模型和物理数据模型。 事实表: 消费事实表(旅客编号ID int12,航班编号ID int12,食物编号ID int12,饮料编号ID int12,季节ID int12,乘坐次数int12,旅客类型char 2,食物消费数量int 4,食品消费金额 float 8,初次乘坐时间datatime 8) 维表: 旅客基本情况表 (编号 int12, 姓名 char12, 证件类型 chat12 , 证件号 char18, 职业 char12, 收入 smallmoney 4, 乘坐季节 datatime 8) 旅客变动情况表(编号 int12,省char20,市char20,县char20,街道char20 ,邮编 int 6, 联系方式 varchar 50) 食品消费情况表 (食品编号 int12, 名称 char12, 类别 char 2, 数量 int 4) 饮料消费情况表 饮料编号 int12, 名称 char12, 类别 char 2, 数量 int 4) 航班情况表 (航班号 char12, 航线号 char12, 飞行里程 int4, 始发站 char10, 目的地 char 10, 时间 datatime 8) 4.为建立第3题中的数据仓库,需要哪些元数据?这些元数据在不同的阶段应该发挥什么作用? 略答:元数据:旅客基本信息,初次乘坐时间,食品消费情况,航班情况等 初次乘坐时记录其编号,便于以后查询和修改 每次乘坐时记录航班状况和食品消费状况 作用:p56-58 第三

文档评论(0)

ahuihuang1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档