- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六讲数据仓库与数据挖掘
1
2014年12月31 日星期三
数据仓库
• 什麽是数据仓库?
• 多维数据模型
• 数据仓库的系统结构
2
Data Mining: Concepts and Techniques 2014年12月31 日星期三
什么是数据仓库?
• 数据仓库已被多种方式定义但没有一种严格的定义。
• 一个与组织结构的操作数据库分别维护的决定支持数据库。
• 为统一的历史数据分析提供坚实的平台,对信息处理提供支
持。
• “数据仓库是一个面向主体的、集成的、时变的、非易失
的数据集合,支持管理过程的决策过程”—W. H. Inmon
• 建立数据仓库
• 构造和使用数据仓库的过程
3
Data Mining: Concepts and Techniques 2014年12月31 日星期三
数据仓库——面向主题的
• 围绕一些主题如顾客、供应商、产品和销售等而组织。
• 关注于决策者的数据建模和分析,而不是集中于组织机构
的日常操作和事务处理。
• 数据仓库排除与对于决策无用的数据,提供特定主题的简
明视图。
4
Data Mining: Concepts and Techniques 2014年12月31 日星期三
数据仓库——集成的
• 通过集成多个异种数据源而构成。
• 关系数据库、一般文件和联机事务处理记录。
• 使用数据清理和数据集成技术。
• 在不同的数据源中,确保命名约定、编码结构、属性度量等
的一致性。
• 例如,旅馆价格:由住宿费、税收、附带的早餐费等等构成。
• 数据被移到数据仓库时就进行了数据转换。
5
Data Mining: Concepts and Techniques 2014年12月31 日星期三
数据仓库——时变的
• 数据仓库的时间范围明显长于操作系统.
• 操作数据库:当前的有用信息。
• 数据仓库数据:从历史的角度提供信息(例如:过去的
5-10年)
• 数据仓库的每一个关键结构
• 隐式或显示的包含时间元素
• 但操作数据的关键结构可以包含也可以不包含“时间元
素”
6
Data Mining: Concepts and Techniques 2014年12月31 日星期三
数据挖掘——非易失的
• 数据仓库总是物理地分离存放数据,这些数据源于操作环
境下的应用数据
• 操作性的数据更新不会发生在数据仓库的环境下.
• 数据仓库不需要事务处理、恢复和并发控制机制
• 它只需要两种数据访问:
• 数据的初始装入和数据访问
7
Data Mining: Concepts and Techniques 2014年
您可能关注的文档
最近下载
- 海外社交媒体营销及绩效优化.pptx VIP
- 指导青年教师活动记录.doc VIP
- 冰雪奇缘中英文台词完整版.pdf VIP
- 名词的单复数教学完整ppt课件.pptx VIP
- 高中英语选择性必修4优质课公开课Unit 4 Project.pdf
- 珊瑚鱼识别:热带太平洋 Reef Fish Identification:Tropical Pacific[英文版].pdf VIP
- 指导青年教师活动记录.docx VIP
- 格拉斯哥昏迷评分.docx VIP
- 文华财经期货软件指标公式源码外汇期货买卖提示指标公式.doc VIP
- 包头东宝生物技术股份有限公司年产3500吨新工艺明胶建设项目竣工.PDF VIP
文档评论(0)