- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第1章数据仓库与数据挖掘概述 随着信息技术的不断推广和应用,许多企业都已经在使用管理信息系统处理管理事务和日常业务。这些管理信息系统为企业积累了大量的信息。企业管理者开始考虑如何利用这些信息海洋对企业的管理决策提供支持。因此,产生了与传统数据库有很大差异的数据环境要求和从这些海洋数据中获取特殊知识的工具需要。 本章目标: (1)了解数据仓库的发展与展望 。 (2) 理解数据仓库的体系结构和参照结构。 (3) 初步了解数据挖掘技术、数据挖掘技术与工具 。 (4) 掌握数据挖掘的应用 。 数据仓库与数据挖掘概述 1.1数据仓库的发展与展望 1.2数据仓库的体系结构 1.3数据仓库的参照结构 1.4数据挖掘技术概述 1.5数据挖掘技术与工具 1.6数据挖掘的应用 练 习 1.1数据仓库的发展与展望 1.1.1从传统数据库到数据仓库 随着市场竞争的加剧,信息系统的用户已经不满足于仅仅用计算机去处理每天所发生的事务数据,而是需要信息——能够支持决策的信息,去帮助管理决策。这就需要一种能够将日常业务处理中所收集到的各种数据转变为具有商业价值信息的技术,传统数据库系统无法承担这一责任。因为传统数据库的处理方式和决策分析中的数据需求不相称。这些不相称性主要表现在决策处理中的系统响应问题、决策数据需求的问题和决策数据操作的问题。 1.1数据仓库的发展与展望 1.决策处理的系统响应问题 2.决策数据需求的问题 3.决策数据操作的问题 4.数据仓库与传统数据库的对比 1.1数据仓库的发展与展望 1.1.2 数据仓库的定义与基本特性 定义: “一个面向主题的、集成的、随时间变化的、非易失性数据的集合,用于支持管理层的决策过程”。 特性: 面向主题性 数据集成性 数据的时变性 数据的非易失性 数据的集合性 支持决策作用。 1.1.3 数据仓库的未来发展 基于关系对象数据库的数据仓库 网络的影响 操作型数据仓库要求 Web中的代理技术 1.2 数据仓库的体系结构 1.2.1 数据仓库的概念结构 从数据仓库的概念结构看,应该包含:数据源、数据准备区、数据仓库数据库、数据集市/知识挖掘库以及各种管理工具和应用工具。 1.2.2 虚拟数据仓库结构虚拟数据仓库利用描述了业务系统中数据位置和抽取数据算法的元数据直接从业务系统中抽取查询的数据进行概括、聚合操作后,将最终结果提供给用户 1.2.3 数据集市结构数据集市结构或称为主题结构的数据仓库是按照主题进行构思所形成的数据仓库,没有一个独立的数据仓库。系统的数据不存储在同一数据仓库中,每个主题有自己的物理存储区。 1.2.4 单一数据仓库结构将所有的主题都集中到一个大型数据库中的体系结构。数据源中数据被按照同一标准抽取到独立的数据仓库中,用户在使用时再根据主题将数据仓库中的数据发布到数据集市中。 1.2.5 分布式数据仓库结构在企业各个分公司具有相当大的独立性时,企业总部设置一个全局数据仓库,各个分公司设置各自的局部数据仓库。局部数据仓库主要存储各自的未经转换的细节数据,全局数据仓库中主要存储经过转换的综合数据 1.3数据仓库的参照结构 数据仓库的基本功能包含:数据抽取,数据筛选、清理,清理后的数据加载,设立数据集市,完成数据仓库的查询、决策分析和知识的挖掘等操作。 数据仓库的管理层分成数据管理与元数据管理两部分,主要负责对数据仓库中的数据抽取、清理、加载、更新与刷新等操作进行管理。 数据仓库环境支持层包含数据传输和数据仓库基础两部分。 1.3.1 数据仓库基本功能层 1.3.2 数据仓库的管理层 数据管理层中的数据抽取、新数据需求与查询管理主要负责完成从数据源中抽取数据的管理。 数据仓库中的数据加载、存储、刷新和更新系统则负责对从数据源中所抽取的数据在完成筛选、净化处理以后,将这些数据加载、存储到数据仓库中;捕获数据源中的数据变化,用最新数据充实数据仓库;根据用户的需求和数据仓库管理的要求对数据仓库进行更新等工作。 安全性与用户授权管理系统主要负责数据仓库的安全管理工作。 数据仓库的数据归档、恢复及净化系统主要负责定期对数据仓库中的数据进行归档、备份。净化系统则负责对从数据源所抽取的数据进行数据的筛选、数据标准的统一、数据内容的统一等各种求精、重整净化工作的管理。 1.3.3 数据仓库的元数据管理层 负责管理数据仓库所使用的元数据,其中包括: 数据仓库、数据集市/知识挖掘库和词汇表管理 元数据抽取、创建、存储和更新管理 预定义的查询和报表以及索引管理 刷新与复制管理,登录、归档、恢复与净化管理 1.3.4 数据仓库的环境支持层 数据传输层包含了: 数据传输和传送网络 客户/服务器代理和中间件 复制系统 数据传输的安全保障
您可能关注的文档
- 如何做成功的管理者.doc
- 如何开好壁纸店.doc
- 如何当好科长.doc
- 如何推行行政决策的科学化.doc
- 如何提高中层管理者现代管理技能和水平.doc
- 如何提高管理者的影响力(讲义).doc
- 如何进行行政决策.doc
- 如何选择好的推拉门衣柜.doc
- 如何通过绩效面谈有效激励员工.doc
- 孙子兵法导读第02讲课件2010.ppt
- 预防森林火灾森林防火消防知识宣传学习PPT.pptx
- 2025年安徽含山县卫生健康委员会下属事业单位选调笔试模拟试题含答案详解.docx
- 2025年广东湛江坡头区机关事务管理局招聘编外工作人员笔试模拟试题含答案详解.docx
- 2025年北京市农林科学院招聘43人笔试模拟试题含答案详解.docx
- 2025年工业和信息化部电子第五研究所招聘社会在职人员笔试模拟试题附答案详解.docx
- 2025上半年四川省科学技术厅直属事业单位招聘20人笔试模拟试题附答案详解.docx
- 2024年湖北宜城市卫生健康局所属事业单位校园招聘70人笔试备考题库及完整答案详解1套.docx
- 2024年辽宁葫芦岛市事业单位面向退役本科毕业生士兵招聘74人笔试模拟试题及参考答案详解一套.docx
- 2025年广东清远市公安局第一次警务辅助人员招聘5人笔试模拟试题带答案详解.docx
- 人力资源和社会保障部机关服务中心2024年公开招聘工作人员笔试模拟试题带答案详解.docx
最近下载
- Unit1《实用商务英语写作教程》作者董晓波—教学课件.ppt VIP
- 中西医结合诊所规章制度大全.docx VIP
- (2025年)抗菌药物临床应用知识培训考试题库(附答案).docx VIP
- DLT 5044-2014 电力工程直流电源系统设计技术规程.docx
- 《联合国教科文:教师人工智能能力框架》--中文版.docx
- OpenHarmony应用开发认证考试题库大全-中(多选题汇总).docx
- 山东省济南市历城区2023-2024学年四年级下学期期末考试数学试题 附答案.pdf VIP
- 机封培训课件.pptx VIP
- 2023年7月黑龙江省普通高中学业水平合格性考试物理真题试卷含答案.docx VIP
- 中外新闻传播史考题及答案.pdf VIP
文档评论(0)