olap与数据挖掘.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
olap与数据挖掘

数据仓库、数据仓库的特征、创建数据仓库的步骤、数据分割、数据分割的优点、元数据的类型分类、数据仓库的数据追加的主要方法、什么是分类知识、什么是预测性知识、数据预处理的主要方法、数据的综合级别、数据仓库工具集由哪些分析工具组成。什么粒度、维。结构化数据、半结构化数据的区别。 数据资源管理涉及数据资源生命周期的各个过程。 数据资源管理涉及数据资源生命周期的各个过程包括: 1 数据获取:确保能够收集到必要的原始数据。 2 数据加工:将原始数据加工成为有用的信息。 3 数据利用:确保能够在适当的时间、以适当的形式得到必要的数据和信息;从数据中发现决策所需要的知识。 4 数据报废:在适当的时候废弃过时的数据,并代之以及时、准确的数据。 数据资源管理的技术框架图。 数据仓库与数据库的区别。 1 数据库中的数据是当前业务相关的数据,数据仓库中的数据是企业一段时间以来的历史数据; 2 数据仓库中的数据是从多个业务领域的数据库中抽取出来的,并经过整理,按分析主题重新组织 数据仓库中主题划分时需要遵守的原则。 1 在划分主题时,必须保证每个主题的独立性,也就是说,每一个主题要具有独立的内涵,明确的界限。 2 在划分主题时,需要保证对主题进行分析时所需的数据都可以在此主题内找到,保证主题的完备性。 3 确定主题以后,需要确定主题应该包含的数据,此时应该注意不能将围绕主题的数据与业务处理系统的数据相混淆。 数据仓库系统:对进入数据仓库的原始数据完成抽取、转换、过滤、清洗等处理,最终进入数据仓库,以及对数据仓库中存储的数据进行更新、管理、使用、表现等的相关软件/工具进行集合,用以支持数据仓库应用或管理决策。 元数据的按类型的分类 关于基本数据的元数据:基本数据是指数据源、数据仓库、数据集市和应用程序管理的所有数据。基本数据元数据包括定义、结构的所有描述。 2 用于数据处理的元数据:对数据装载、更新处理、分析处理、管理方面的信息,如数据抽取、转换、聚合规则等的描述。 3 关于企业的组织结构的元数据:包括与企业相关的管理方面的数据和信息,如用户访问数据仓库、数据源、数据集市的权限信息等。 跟其他应用领域相比,在电子商务中进行数据挖掘的优势包括: 电子商务提供海量的数据: “点击流”(Clickstreams)将会产生电子商务挖掘的大量数据; 丰富的记录信息: 良好的WEB站点设计将有助于获得丰富的关于商品、分类、访客等等信息; 干净的数据: 从电子商务站点收集的都是电子数据,无需人工输入或者是从历史系统进行整合; 研究成果容易转化: 在电子商务中,很多知识发现都可以进行直接应用; 投资收益容易衡量: 所有数据都是电子化的,可以非常方便的生成各种报表和计算各种收益。 请分析创建数据仓库与数据集市的模式的两种方式及其优点。 答1) 自顶向下:这种模式首先把OLTP数据通过ETL汇集到数据仓库中,然后再把数据通过复制的方式推进各个数据集市中,其优点在于: 1 数据来源固定,可以确保数据的完整性。 2 数据格式与单位一致,可以确保跨越不同数据集市进行分析的正确性。 3 数据集市可以保证有共享的字段。因为都是从数据仓库中分离出来的。 2) 自底向上:这种模式首先将OLTP数据通过ETL汇集到数据集市中,然后通过复制的方式提升到数据仓库中,其优点在于: 1 由于首先构建数据集市的工作相对简单,所以容易成功。 2 这种模式也是实现快速数据传送的原型。 数据仓库、据仓库的特征。 数据仓库就是面向主题的、集成的、不可更改的、随时间不断变化的数据集合,用于支持经营管理中的决策制定过程。 特征: 1.数据仓库中的数据是面向主题的 2. 数据仓库中的数据是集成的 3.数据仓库的数据是不可更改的 4.数据仓库中的数据是随时间不断变化的 什么是数据分割、数据分割的优点有哪些 分割是指将数据分散到各自的物理单元中去以便能分别独立处理,以提高数据处理效率 分割是指将数据分散到各自的物理单元中去以便能分别独立处理,以提高数据处理效率。 对当前细节数据进行分割的总体目的就是把数据划分成小的物理单元,为操作者和设计者在管理数据时提供更大的灵活性。 小物理单元具有容易重构、自由索引、顺序扫描、容易重组、容易恢复和容易监控等优点。 数据仓库的本质之一就是灵活的访问数据,大块数据达不到这个目的。 请说明元数据的按类型的分类 1 关于基本数据的元数据:基本数据是指数据源、数据仓库、数据集市和应用程序管理的所有数据。基本数据元数据包括定义、结构的所有描述。 2 用于数据处理的元数据:对数据装载、更新处理、分析处理、管理方面的信息,如数据抽取、转换、聚合规则等的描述。 3 关于企业的组织结构的元数据:包括与企业相关的管

文档评论(0)

tiangou + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档