- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库与数据挖掘 第1章 数据仓库的概念与体系结构 谢红侠 1.1 数据仓库的概念、特点与组成 数据仓库的概念 数据仓库就是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,通常用于辅助决策支持(DDS) 1.1 数据仓库的概念、特点与组成 数据仓库的特点: 面向主题; 集成的; 相对稳定的; 反映历史变化。 1.1 数据仓库的概念、特点与组成 数据仓库的组成: 数据仓库数据库; 数据抽取工具; 元数据:技术元数据与业务元数据; 访问工具; 数据集市(Data Marts); 数据仓库管理; 信息发布系统。 1.2 数据挖掘的概念与方法 数据挖掘的概念 数据挖掘(Data Mining),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识,又被称为数据库中的知识发现(Knowledge Discovery in Database, KDD) 1.2 数据挖掘的概念与方法 数据挖掘的方法: 直接数据挖掘 间接数据挖掘。 1.2 数据挖掘的概念与方法 数据仓库与数据挖掘的关系 若将数据仓库(Data Warehouse)比作矿井,那么数据挖掘(Data Mining)就是深入矿井采矿的工作 数据挖掘是从数据仓库中找出有用信息的一种过程与技术 1.3 数据仓库的技术、方法与产品 联机事务处理(OLTP)与联机分析处理(OLAP)的比较; OLAP技术的有关概念 :多维数据集、维度、度量值和多维分析; OLAP根据其存储数据的方式可分为三类:ROLAP、MOLAP、HOLAP OLAP工具 1.3 数据仓库的技术、方法与产品 数据仓库实施中的三个关键环节 数据抽取; 数据存储与管理 数据表现 1.3 数据仓库的技术、方法与产品 数据仓库实施方法论 数据仓库不是简单的数据或产品堆砌,它是一个综合集成解决方案和系统工程。在数据仓库的实施过程中,技术决策至关重要,技术选择或决策错误很可能导致项目实施失败 1.3 数据仓库的技术、方法与产品 常用数据仓库产品比较 常用OLAP工具介绍 ; 各数据仓库厂商提供的解决方案 IBM、Oracle、NCR、Microsoft、SAS等 1.4 数据仓库系统的体系结构 数据仓库系统的体系结构的分类 (1)两层架构(Generic Two-Level Architecture)。 (2)独立型数据集市(Independent Data Mart)。 (3)依赖型数据集市和操作型数据存储(Dependent Data Mart and Operational Data Store)。 (4)逻辑型数据集市和实时数据仓库(Logical Data Mart and Real-Time Data Warehouse)。 1.4 数据仓库系统的体系结构 1.4 数据仓库系统的体系结构 1.4 数据仓库系统的体系结构 1.4 数据仓库系统的体系结构 1.5 数据仓库的产生、发展与未来 数据仓库的产生 联机事务处理系统(业务系统)刚上线时,查询不到数据是因为数据太少了,而几十年后查询不到有关数据是因为数据太多了。针对这一问题,人们设想专门为业务数据的统计分析建立一个数据中心,它的数据从联机事务处理系统中来、从异构的外部数据源来、或从脱机的历史业务数据中来,这个数据中心也是一个联机系统,它专门为分析统计和决策支持应用服务,通过它可获取决策支持和联机分析应用所需要的一切数据。这个数据中心就叫做数据仓库。简单地说,数据仓库就是一个作为决策支持和联机分析应用系统数据源的结构化数据环境,数据仓库要研究和解决的问题就是从数据库中获取信息的问题。 1.5 数据仓库的产生、发展与未来 数据仓库的发展 以报表为主 以分析为主 以预测模型为主 以营运导向为主 以实时数据仓库、自动决策应用为主 1.5 数据仓库的产生、发展与未来 数据仓库的未来 在数据抽取方面,未来的技术发展将集中在系统集成化方面。它将互连、转换、复制、调度、监控纳入标准化的统一管理,以适应数据仓库本身或数据源可能的变化,使系统更便于管理和维护。 在数据管理方面,未来的发展将使数据库厂商明确推出数据仓库引擎,作为数据仓库服务器产品与数据库服务器并驾齐驱。在这一方面,带有决策支持扩展的并行关系数据库将最具发展潜力。 在数据表现方面,数理统计的算法和功能将普遍集成到联机分析产品中,并与Internet/Web技术紧密结合。按行业应用特征细化的数据仓库用户前端软件将成为产品作为数据仓库解决方案的一部分。数据仓库实现过程的方法论将更加普及,
您可能关注的文档
最近下载
- 2025年(H12-611) HCIA OpenEuler认证考试题库(含答案).doc VIP
- 酒店管理与数字化运营专业论证报告.pdf VIP
- 2025-2030中国牛仔服装行业市场深度发展趋势与前景展望战略研究报告.docx
- 生猪屠宰车间劳务外包协议书5.docx VIP
- 工业园区安保计划方案.docx VIP
- 毕业设计(论文)答辩模板答辩33.ppt VIP
- 新22J09 附属建筑-标准图集.docx VIP
- 1.2国家的政权组织形式 高中政治《当代国际政治与经济》(统编版选择性必修1).pptx VIP
- 八大特殊作业安全管理培训(最新版课件).pptx
- 酒店管理专业人才需求调研报告.doc VIP
文档评论(0)