MIS技术基础1讲解.ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 管理信息系统的技术基础;(1)文件组织方式 (2)数据库技术 (3)项目管理技术;1、数据组织的层次结构 2、关键字的概念 3、逻辑结构与物理结构的概念;;数据库;四个层次含义如下: 数据项:是数据组织的基本单位,是文件中可使用的最小单位,描述事物某一方面的属性。 记录:是文件中可存取的最小单位,一般由若干个数据项组成,描述了事物的属性集合。 文件: 同质(类)记录的集合构成文件。 数据库 是逻辑相关的文件集合,是数据组织的最高形式。;关键字(主键)为了识别一个记录,通常选用记录中的一个或若干个数据项作为鉴别键(KEY),其中,能唯一识别某一记录的鉴别键称为主键(关键字),其余的则称为副键。;物理结构:又称为数据的存贮结构,是指数据元素在计算机存贮器中的表示及其配置。 存储方法有四种:顺序存储方法、链接存储方法、索引存储方法和散列存储方法。; 把四个结点按工作证号升序排列,组成一个链 ;文件的组织方式;文件: 是在逻辑上具有完整意义的信息的集合。 文件组织: 是指数据记录以某种数据结构形式在外存设备上的组织。 文件组织方式: 指文件内部构造数据的方式。主要有顺序、索引、直接、多关键字文件组织方式,并提供有效的存取方法。;(1)顺序访问设备,如磁带等;直接访问设备,如磁盘等。顺序访问设备因信息存入的物理位置以及当前读写磁头位置的不同,其读写时间也可能不同。 (2)直接访问设备,就是访问信息的时间与信息在外存上的存放位置关系不大。;概念:将一个文件中逻辑上连续的信息存放到存储介质的依次相邻的块上便形成顺序结构。这类文件叫顺序文件。其记录存贮情况如下:;存贮在顺序存取设备上的顺序文件,只能按照顺序扫描法进行查找,即依次逐个查找,要先检索第I个记录,必须先检索I-1个记录。 存贮在直接存取设备上的顺序文件可以按顺序扫描法查找,也可按分块查找或“折半”。; 顺序文件,只适用于批处理的情况下使用,对于单个记录进行处理时不方便,特别是当记录有增删时就更不方便,所以在单个记录要求实时处理的情况下,为了对某个记录及时处理,就要用到索引文件了。 ;索引表建在索引区,表结构由每个记录的关键字和相应的物理存贮地址组成,我们将这两项合称为索引项。 数据文件建立在数据区。 索引非顺序文件:索引表的索引项按顺序排列,而数据文件本身记录不按顺序排列,则称为索引非顺序文件。 索引顺序文件:索引表的索引项按顺序排列,而数据文件本身记录也按顺序排列,则称为索引顺序文件。 ;增添记录 在原数据文件末尾加上新增加记录,同时对索引表插入一个新的索引项(维持有序)无需改变原数据记录的存贮状态。;删除记录 逻辑删除:待删记录前打标记后,整理索引表。 物理删除:对数据文件重组,形成新的索引表。;索引文件总结: ①索引文件只能在直接存取设备上组织。 ②具有地址唯一性,不产生重号。 ③单个记录存取速度比较快。 ④索引表本身占据一定的索引空间 。 ⑤各级索引均为线性表结构,每次修改都要重建索引。;概念   直接存取文件是不需要索引而根据某个算法直接定位文件记录的组织形式,只能在直接存取(随机)设备实现。;有三种方法来实现: 直接地址法:记录地址→关键字 相对键法:DRK=F(K) K为关键字 哈希法:采用Hashing函数。(杂凑法) 一般情况下,直接存取文件就是指用哈希法组织的文件。 A 直接地址法:程序员可以把存放某一记录的地址作为该记录的鉴别键的值,这样要检索某一记录时,只要给出了该记录的键值,也就给出了该记录的存放地址。;B 相对键法:采用相对键法进行存取时,可以调用一算法过程对记录的键号进行计算,求出相应的记录地址。;C 哈希法:就是指采用一种Hashing函数的算法把记录的键值转换为相应的地址,达到压缩存贮空间的目的。 算法: Hashing函数的算法很多,这里介绍质数除余法。;例:键号为10000到5000的记录,记录总数为5000个,则P取4999,其地址为: H(10000)=10000-INT (10000/4999) ×4999 =2 H(5000)=5000-INT (5000/4999) ×4999 =1 全部记录分布在0≤H(K)≤M-1;采用哈希法组织文件时,总是希望能通过某一Hashing函数的计算将记录均匀地分散到存贮单元中去,但实际上无论采用哪种Hashing函数,都不可避免地产生碰撞现象,即两个不同键号经Hashing函数计算而得到的地址结果一样,即产生冲突。解决碰撞的方法一般有两种: ①开放地址法 ②溢流表法 思路:用Hashing函数算法计算出来的地址,如已被占满,再依次下推,达到最后一个单元后,再转回第一个单元,直到这个记录存贮完

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档