- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库元数据4数据挖掘1.为什么不能依靠传统的业2-51Testing
复习资料
一.名词解释
1.数据仓库: 数据仓库是为企业所有级别的决策制定过程提供支持的所有类型数据的战
略集合。它是单个数据存储,出于分析性报告和决策支持的目的而创建。 为企业提供需要
业务智能来指导业务流程改进和监视时间、成本、质量和控制。
2 .螺旋式周期性开发方法: 针对未来航空电子系统面临的挑战和航空电子系统设计的特
点,提出了基于原型仿真的航空电子系统螺旋式开发方法
3 .数据仓库元数据:在数据仓库中,元数据是描述数据仓库数据的结构和建立方法的数据。
4 数据挖掘:是数据库知识发现中的一个步骤。数据挖掘一般是指从大量的数据中通过算
法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处
理、情报检索、机器学习、专家系统和模式识别等方法来实现目标。
5 .数据集市:一种更小、更集中的数据仓库。原始数据从数据仓库流入不同的部门以支
持这些部门的定制化使用。这些部门级的数据库就称为数据集市。迎合了专业用户群体的特
殊需求。
二、简答题
1.为什么不能依靠传统的业务处理系统进行决策分析?
传统业务系统数据量少,不能用来做出正确的预测,是针对日常事务处理而设计的,
因此不能支持短时间内大量数据的分析和计算;传统业务系统数据杂乱,可能存在大量的坏
数据以及异常数据,会影响决策分析的正确性。如果在传统业务系统中进行决策分析,那么
必然会影响到系统的使用
2 .数据粒度,数据粒度划分策略
数据仓库中数据的细化和综合程度。
划分为:详细数据、轻度总结、高度总结三级。原则:细化程度越高,粒度越小;细化
程度越低,粒度越大。
3 .数据仓库的体系结构
数据源、数据存储和管理、OLAP 服务器以及前端工具与应用四个部分
4 .MOLAP 和ROLAP 在OLAP 的数据存储特点
MOLAP 基本数据和聚合数据存放于多维数据集中,ROLAP 基本数据和聚合数据均存
放在RDBMS 之中
5 .请列出常见的现代数据挖掘技术
知识发现技术、规则型挖掘技术、神经网络型挖掘技术、遗传算法型挖掘技术、粗糙型
挖掘技术、决策树型挖掘技术、
三、简述关联规则挖掘算法Apriori 的算法思想并说明如何利用Apriori 性质
生成频繁项集。
首先遍历目标数据库一次,记录每个项目或属性的出现次数,即计算每个项目的支持度,
收集所有支持度不低于用户最小支持度的项目构成频繁 1-项集L1,然后链接L1 中所有的元
素形成候选2 项集C2,再次遍历事务数据库,计算C2 中每个候选2-项集的支持度,收集所有支
持度不低于用户最小支持度的项目构成频繁2-项集L2,再链接L2 形成C3,遍历数据库得L3,
反复执行以上过程,直到没有候选项集为止。
设定最小支持度s 和最小置信度c 。使用候选项集。首先产生出候选的项的集合,即候选
项集,若候选项集的支持度大于或等于最小支持度,则该候选项集为频繁项集。
四、简述数据仓库中需要的元数据,这些元数据在不同的阶段应该发挥的作
用
技术元数据和业务元数据。
作用:1、描述哪些数据在数据仓库中;2 、定义要进入数据仓库中的数据和从数据仓库
中产生的数据;3、记录根据业务事件发生而随之进行的数据抽取工作时间安排;4 、记录并
检测系统数据一致性的要求和执行情况;5、衡量数据质量。
五、通过以下给出的“出版社销售图书Pubs”数据库模型,设计一个“图书销售分析”
的多维数据集模型,并详细描述如何利用SQL Server2008 的相关组件建立该多维数据集的
过程。
数据分析需求:建立出版社维度、作者维度、图书维度、书店维度、时间维度对图书销
售业绩进行统计(多维数据集模型按事实表和维度表之间的星型、雪花型或星型雪花混合型
的结构设计)
答:1、打开 SQL;2、附加备份的数据库文件并做出优化;3、修改数据库属性;4、
建立数据仓库所需的数据库 bb (导出);5、创建新的分析服务项目;6、新建数据源(本
地服务器输入“.”)7、建立多维数据集;8、处理多维数据集,得出模型
六、在超市中的商品价
文档评论(0)