- 1、本文档共50页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
工程数据库的数据模型 扩展的关系数据模型 对象数据模型 语义数据模型:利用实体、联系、和约束得来描述现实世界的静态、动态和视台特征。具有较高的抽象层次和较强的语义表达。 设计方案的版本p178 在设计过程中产生多个不同的方案,每个设计方案就是一个版本。 每个方案都具有很高的参考价值。因此需要管理。 版本因包含的信息: 设计信息 对象与版本的关联信息。 版本标识信息 附加的版本管理信息。 版本管理 线性版本管理模型 树型版本管理模型 有向无环版本管理模型 九、数据仓库 基本概念 ⑴ 数据仓库的定义 数据仓库Data Warehouse-DW:是面向主题的、集成的、稳定的,并且时变地收集不同数据的一种数据集合的结构形式,用以支持经营管理中的决策制定过程。 面向主题:数据仓库中的数据是面向主题的,而传统数据库是面向应用的。主题是在较高层次将数据归类的标准,每个主题对应一个宏观分析领域。 集成特性:数据仓库的集成特性是指在数据进入数据仓库之前,必须经过转换、加工和集成,或称“整合”处理。这是建立数据仓库的关键步骤。首先要解决原始数据的一致性,消除矛盾,使数据完整、统一;其次还要把面向应用的原始数据结构转变为面向主题的。 稳定性:数据仓库反映的是历史性的数据内容,而不是日常事务处理产生的数据,经加工和集成进入数据仓库后,基本上不再修改。在一次数据分析的执行过程中使用的数据不得变更,这样才能保证两次使用同一组信息进行分析时不会得出不同的答案。 不同时间的集合:要求数据仓库是不同时间的数据集合,这种数据保存的时限能满足进行决策分析的要求,而且在数据仓库中要标明这些数据的历史时期。 数据仓库系统的组成 数据仓库DW 组成 事实表:存储历史商务数据的表。通常不更新。 维表:用于提炼事实表中所包含的数据。减少了对事实表扫描的数据量,提高了查询性能。维表中的数据常需更新 模式 星型模式 雪花模式 数据仓库管理系统 对数据仓库进行数据建模。 确定从源数据到数据仓库的数据抽取、转换和装载等。 确定数据仓库的存储方式。 管理数据的安全、归档、维护、备份、恢复等工作。 分析工具 用户查询工具 C/S检索工具 OLAP分析工具 数据挖掘(DM)工具(Data Mining) DW查询系统 特点 报表杳询:从DW中产生各种业务报表,一般为多表联接、累计、分类、排序等。 随机、动态查询:根据上次查询结果,进行进一步的查询,又称为DM。 共同特点:数据量大、查询速度受到限制。 应考虑的问题: 数据仓库中数据库的可扩展能力。 系统的并发查询处理能力。 OLAP OLTP和OLAP的区别 联机事务处理OLTP系统,它是事件驱动、面向应用的。 联机分析处理OLAP系统,是基于DW的信息分析与处理过程,OLAP是跨部门的、面向主题的。 OLTP和OLAP的区别 OLTP 分析型 细节的 综合的 操作需求事先可知道 操作需求事先不知道 对性能要求高 对性能要求宽松 一个时刻操作一个单元 一个时刻操作一个集合 事务驱动 分析驱动 一次操作数据量小 一次操作数据量大 支持日常操作 支持管理决策需求 OLAP的基本概念 变量: 是决策者所关心的具有实际意义的数量。 维:人们观察数据的特定角度。如:时间、地区等 维的层次:观察数据的某个特定角度的不同细节程度的方面。例:时间维中的日期、月份、季度、年度等 维成员:维的一个取值。例如:某年某月 多维数组:可表示为(维1,维2,…,维n,变量),例如:日用品的销售数据按地区、时间和销售渠道组织起来的三维立方体,加上变量“销售量” 多维分析: 指对以多维方式组织起来的数据采取切片,切块、旋转、钻入、归并等各种分析动作,是分析者、决策者能从多个角度、多个侧面观察数据。 切片:选定多维数组的一个二维子集的动作。 切块:选定多维数组的一个三维子集的动作。 旋转:改变一个报告或页面显示的维方向。 钻入:对结果数据的下一层数据进行剖析。 归并:是钻入的反向处理。 数据挖掘DM 1、数据挖掘的定义 数据挖掘,Data Mining, 就是从大型数据库中的数据中提取人们感兴趣的知识。MD与KDD(Knowledge discovery in database) 有很大的重合度,一般在AI领域称KDD。 2、数据挖掘的目的 发现大量数据中尚未发现的知识,是系统内部自动获取知识的过程 学会方法:OLAP、OLTP等 3、 DM的相关领域 归纳学习(inductive learning) 机器学习(machine learning),关系最为密切 统计(statistics)分析 4、决策支持空间 数据空间(data space):处理基于关键字的查询,如OLTP 聚合空间(aggregation space):数据空间 聚合运算(su
您可能关注的文档
- 05第15章矿井瓦斯与矿尘.ppt
- 05第五章人类活动地域格局.ppt
- 05组织行为学(第五章、工作态度).ppt
- 06无限极产品介绍与搭配.ppt
- 06雅典城邦的民主政治.ppt
- 各种观赏花卉和野花的名字.ppt
- 0702星罗棋布的氏族生活(修改版).ppt
- 07对比衬托渲染烘托虚实诗歌技巧描写手法邹 (2).ppt
- 07对比衬托渲染烘托虚实诗歌技巧描写手法邹.ppt
- 各类人群的营养.pptx
- 2024年畜牧服务项目资金需求报告代可行性研究报告.docx
- 2024年蛭石项目资金需求报告代可行性研究报告.docx
- 2024年化学纤维加工丝项目资金申请报告代可行性研究报告.docx
- 2024年吸附剂项目资金需求报告代可行性研究报告.docx
- 2024年太阳能发电项目资金筹措计划书代可行性研究报告.docx
- 2024年工程起重机械项目资金筹措计划书代可行性研究报告.docx
- 2024年微波暗室设备项目资金申请报告代可行性研究报告.docx
- 2024年丙二酮项目投资申请报告代可行性研究报告.docx
- 2024年PBT项目资金申请报告代可行性研究报告.docx
- 2024年大地测量仪器项目资金筹措计划书代可行性研究报告.docx
最近下载
- 作文草稿纸模板.docx VIP
- 税务局2023年税务执法资格模拟考试题及答案.doc VIP
- 商用车行业月报-货车行业:8月内需偏淡,出口景气维持,以旧换新效果有望逐月显现-240922-方正证券-17页.pdf VIP
- 工程电磁场与电磁波答案(丁君).pdf
- SNT 0370.2-2021出口危险货物包装检验规程第2部分性能检验.pdf
- 江苏省淮安市2024届高三上学期第一次月考历史试题及答案解析.docx
- 部编版一年级上册语文《四季》第一课时课件.ppt
- 2021新译林版高二英语选择性必修二第二单元课文原文及单词表(word可编辑).docx
- 中药学(张廷模).doc
- 幼儿园中班语言秋天的颜色.ppt VIP
文档评论(0)