- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六节数据库跟数据仓库--pzz
第六章 数据库与数据仓库 一、数据管理的概念 数据的层次 字符:信息的最基本架构,用一个字节来表示; 字段:以某种方法描述的业务对象或活动的字符组合; 记录:相关字段的一组集合; 文件:相关记录的集合。 数据的层次 2. 数据实体、属性和键 3.数据管理的传统方法 传统管理方法示意 4.数据管理的数据库方法 数据库方法:一种数据管理方法,其中相关数据集合可由多个应用程序共享。 二、在数据库中组织数据 1.数据建模和实体关系图 数据资源管理技术 10.1 文件组织 数据组织的层次 文件分类 数据的物理储存与传送 文件组织方式 10.2 数据库技术 传统的文件处理与数据库处理 数据库管理系统(DBMS) 数据库的类型 数据库模型与数据库组织结构 数据库设计 第一节 数据库技术 一、数据管理技术及其发展 一、数据管理技术及其发展 一、数据管理技术及其发展 一、数据管理技术及其发展 二、数据库系统的组成 二、数据库系统的组成 二、数据库系统的组成 三、数据库系统的体系结构 四、概念模型 四、概念模型 (二)概念模型的表示方法 实体-联系方法(Entity-Relationship Approach)用E-R图来描述现实世界的概念模型 数据模型分析 层次模型:数据按“自顶向下”的结构进行组织。 网状模型 网状模型是层次模型的扩展,其中一个属记录可以有多个首记录。 五、数据模型 五、数据模型 (三)、E—R图向关系数据模型的转换 五、数据模型 五、数据模型 数据分析和规范化问题 数据分析:一种对数据进行评价以揭示数据库内容中存在问题的过程。 六、关系的规范化 七、数据库保护 七、数据库保护 第二节 数据仓库 二、数据仓库的定义及特点 三、数据仓库系统的体系结构 四、数据仓库的应用 三、数据库管理系统 数据库管理系统(database management system,DBMS):由一组程序执行数据库的实际操作,并提供数据库与用户和数据库与应用程序的接口。 2.提供用户视图 子模式:包含对数据库的一个子集的描述及确定哪些用户可对该子集的数据项进行修改操作的文件。 3.创建及修改数据库 数据库定义语言(data definition language,DDL):是定义和描述某一特定数据库中数据及数据关系的各种指令及命令的集合。 数据字典:数据库中所有数据的详尽描述。 4.操纵数据和生产报表 数据操纵语言:是一种包含操纵数据库命令的语言; 结构化查询语言:一种标准化的数据操纵语言。 四、数据库发展趋势 分布式数据库:一种数据库,其实际的数据可能散布在多个由通信设备联接的较小数据库中。 复制数据库:一种数据库,其中含有经常使用的数据的副本。 2.数据仓库 3.数据集市 数据集市是数据仓库的一个子集。 5.数据挖掘 数据挖掘:自动地找出数据仓库中的模型及关系。 7.面向对象的数据库 面向对象数据库:可将数据作为对象进行存储的数据库,对象中包含了数据,又包含了完成数据库事务处理所需的各种处理指令。 9.空间数据技术 五、管理数据库 数据库管理:数据库各方面的管理。 数据库的使用、政策和安全性 一、数据仓库发展的由来 联机事务处理不适合DSS应用的原因概括起来主要有以下四点:第一、联机事务处理环境下的数据是分散而非集成的,业务数据往往被存放于分散的异构环境中,不易被统一查询访问,而且还有大量的历史数据处于脱机状态,形同虚设;第二、事务处理系统不具备数据动态集成的能力,数据源中数据发生的变化不能反映给决策者;第三、对于决策分析而言,历史数据是相当重要的,企业的事务处理一般只需要当前数据;第四、业务数据的模式是针对事务处理系统而设计的,数据的格式和描述方式并不适合非计算机专业人员进行业务上的分析和统计。 于是,有人感叹:20年前查询不到数据是因为数据太少,而今天查询不到数据是因为数据太多。针对这一问题,人们专门为业务的统计分析建立一个数据中心,它的数据可以从联机的事务处理系统、异构的外部数据源、脱机的历史业务数据中得到。它是一个联机的系统,专门为分析统计和决策支持应用服务,通过它可满足决策支持和联机分析应用所要求的一切。这个数据中心就叫数据仓库。可以把它看作一个作为决策支持系统和联机分析应用数据源的结构化数据环境。 据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。 数据仓库的4个特点: 1、面向主题。传统数据库的数据组织面向事务处理任务,各个业务系统之间各自分离;而数据仓库中的数据是按照一定的主题进行组织的
原创力文档


文档评论(0)