管理信息系统教程第5章数据库与数据资源管理.ppt

管理信息系统教程第5章数据库与数据资源管理.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
长春理工大学 董元方 管理信息系统 第5章 数据库与数据资源管理 主要内容 5.1 文件组织 5.2 数据库概述 5.3 数据库设计 5.4 数据仓库与数据挖掘技术 引例:告别“拍脑袋”决策 啤酒和尿布 在如今的商业环境中,企业面临大量的数据,如何在这些看似杂乱无章、错综复杂的信息中理出头绪,分析提炼出知识,从而帮助企业管理者做出及时、正确的决策,最终让企业占领先机、取得竞争优势,正是 BI 的用武之地。时至今日,BI 已经成了一种定量数据分析管理技术,将存储于各种商业信息系统中的数据转换成知识, 向企业各级管理者尤其是 CEO 提供决策支持,从而提高决策效率和水平。在西方,像沃尔玛一样运用 BI 技术帮助决策,在企业中已经比较普遍,许多企业的 CIO(首席信息官)把 BI 作为最优先选择的三项信息技术之一。 BI 近年来逐渐成为热点,可以说是企业信息化发展到一定程度的必然。BI 能够运算大量信息,然后为企业找出市场趋势和经营上的问题,并发现市场的新机会,这正是企业一直以来都在寻找的软件。 5.1 文 件 组 织 5.1.1 文件的基本概念 1.指针与地址 地址是数据存储位置的标志。例如,用文件记录中的某种顺序编号或用符号名来标识地址。 在一个记录中,若以某一属性来表示相关记录所在的地址时,则称此地址为指针,即由该记录指向相关记录的指针。 2.链表 由于每一个记录都有指针,并用它指示下一个记录所在的位置,因此,这些记录之间的前后关系完全由指针表示,称这组记录为链表结构。 3.树 需要注意,记录的指针不允许指向同一层次的记录,下一层的记录允许上一层中一个记录指向,最后一层记录不再指向其他记录,或称它们只有空指针。如果树结构的记录集合中每个记录只允许两个指针指向下一层,则称这种树结构为二叉树结构。 4.散列函数 将记录的关键字做变换,变换的结果即为记录所存放的地址。该变换的函数称为散列函数或Hashing函数。显然,这样变换出来的地址是不连续的,散列在某一个区域内。因此,在选择散列函数时,要使其算法简单,而且使其变换的地址在某一区域内散列得比较均匀,尽可能地减少冲突现象。所谓冲突现象,是指不同记录的关键字值经变换后得到的相同记录地址。对于冲突应有冲突的处理算法。 5.1.2 文件组织方式 文件组织就是按一定的逻辑结构把有关联的数据记录组织成为文件(称为逻辑文件),并用体现这种逻辑结构的物理存储形式把文件中的数据存放到某种存储设备上,使之构成物理文件。 目前文件组织方式主要有下面4种。 1.顺序文件 文件中记录的顺序按记录关键字值的顺序排列。 例如,一个学生的档案记录所组成的文件按学号这一关键字的顺序排列。 这类文件关于连续存取记录的访问效率很高,因此,这种存取方式适用于需要批量处理数据的组织。 2.索引文件 3.计算存取文件(散列文件) 这种文件组织中的记录是随机存放的,第i个记录的存放地址是A(Ri)=H(Ki)。A(Ri)为第i个记录Ri的所在地址,H为某一散列函数,Ki为记录Ri的关键字。这种文件的记录地址是通过散列函数计算出来的。 4.倒排文件 文件系统的功能是由操作系统实现的,具体有以下几点功能。 (1) 决定文件的存放位置、存放形式及存取权限等。 (2) 按名存取,建立从文件名到文件地址之间的映射关系。 (3) 实施对文件的建立、删除、打开、关闭、读、写、修改、复制及各种控制操作。 (4) 管理与文件存取有关的存储空间 5.2 数据库概述 2.数据库系统 3.数据库系统的体系结构 1) 单用户结构的数据库系统:一种早期的最简单的数据库系统。 包括应用程序、DBMS、数据,都装在一台计算机上,由一个用户独占,不同计算机之间不能共享数据。 2) 主从式结构的数据库系统:一个主机带有多个终端的多用户结构。 数据库系统,包括应用程序、DDMS、数据等都集中存放在主机上,所有处理任务都由主机来完成。 各个用户通过主机的终端并发地存取数据,共享数据库中的数据资源。 3) 分布式结构的数据库系统:指数据库中的数据在逻辑上是一个整体,但物理上分布在计算机网络的不同节点上。 网络中的每个结点都可以独立处理本地数据库中的数据,执行局部应用;同时也可以同时存取和处理多个异地数据库中的数据,执行全局应用。 4) 客户/服务器结构的数据库系统:把DBMS功能与应用分开。 网络某个节点上的计算机专门用于执行DBMS功能,称为数据库服务器,其他节点上的计算机则安装DBMS的外围应用开发工具,支持用户的应用,称为客户机。 5.2.2 数据库发展 数据处理的核心问题是数据管

文档评论(0)

autohhh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档