数据库应用及设计-数据仓库及数据挖掘.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六讲数据仓库与数据挖掘 1 2014年12月31 日星期三 数据仓库 • 什麽是数据仓库? • 多维数据模型 • 数据仓库的系统结构 2 Data Mining: Concepts and Techniques 2014年12月31 日星期三 什么是数据仓库? • 数据仓库已被多种方式定义但没有一种严格的定义。 • 一个与组织结构的操作数据库分别维护的决定支持数据库。 • 为统一的历史数据分析提供坚实的平台,对信息处理提供支 持。 • “数据仓库是一个面向主体的、集成的、时变的、非易失 的数据集合,支持管理过程的决策过程”—W. H. Inmon • 建立数据仓库 • 构造和使用数据仓库的过程 3 Data Mining: Concepts and Techniques 2014年12月31 日星期三 数据仓库——面向主题的 • 围绕一些主题如顾客、供应商、产品和销售等而组织。 • 关注于决策者的数据建模和分析,而不是集中于组织机构 的日常操作和事务处理。 • 数据仓库排除与对于决策无用的数据,提供特定主题的简 明视图。 4 Data Mining: Concepts and Techniques 2014年12月31 日星期三 数据仓库——集成的 • 通过集成多个异种数据源而构成。 • 关系数据库、一般文件和联机事务处理记录。 • 使用数据清理和数据集成技术。 • 在不同的数据源中,确保命名约定、编码结构、属性度量等 的一致性。 • 例如,旅馆价格:由住宿费、税收、附带的早餐费等等构成。 • 数据被移到数据仓库时就进行了数据转换。 5 Data Mining: Concepts and Techniques 2014年12月31 日星期三 数据仓库——时变的 • 数据仓库的时间范围明显长于操作系统. • 操作数据库:当前的有用信息。 • 数据仓库数据:从历史的角度提供信息(例如:过去的 5-10年) • 数据仓库的每一个关键结构 • 隐式或显示的包含时间元素 • 但操作数据的关键结构可以包含也可以不包含“时间元 素” 6 Data Mining: Concepts and Techniques 2014年12月31 日星期三 数据挖掘——非易失的 • 数据仓库总是物理地分离存放数据,这些数据源于操作环 境下的应用数据 • 操作性的数据更新不会发生在数据仓库的环境下. • 数据仓库不需要事务处理、恢复和并发控制机制 • 它只需要两种数据访问: • 数据的初始装入和数据访问 7 Data Mining: Concepts and Techniques 2014年

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档