- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
空间数据结构补充new
补充章节 空间数据结构 一、信息与数据 信息:是客观事物的存在及其演变情况的反映。 数据:是指可以输入到计算机并能为计算机所处理的一 切对象(数字、文字、符号、声音等)。 信息与数据的关系:信息是数据的内容,数据是信息的表达。 数据的分类 功能分类(标识数据、计量数据……) 结构特征分类(格式化数据、非格式化数据) …… 数据的层次单位 逻辑单位:数据项、数据项组、记录、文件、数据库 物理单位:位、字节、字、块、簇、卷 文件组织 文件组织 特点 优点 缺点 备注 串行文件 依次保存记录的文件形式 连续存取速度快; 插入记录方便。 不适合于随机查找; 适用于备份数据、日志 顺序文件 记录按照关键字大小升序、降序排列 修改与删除记录简单 插入记录困难 二分查找、分块查找、插值查找 索引文件 索引非顺序文件 稠密索引:建立所有记录的键值与地址的索引表 可以实现预查找 索引表太大,占用过多的存储空间 主文件:非顺序 索引文件:顺序,稠密 索引顺序文件 稀疏索引:对记录排序,分块,建立分块与地址的索引表 索引较小,对索引的存储空间管理要求低 记录必须有序,不能实现预查找 主文件:顺序 索引文件:顺序,稀疏 文件组织 特点 优点 缺点 备注 直接存取文件(散列文件) A(Rk) = H(k) R k是键值为k的记录,A为记录地址,H为散列函数 方法简便,存取速度快,节省存储空间,检索时间与文件大小无关,插入、删除和修改的效率高 溢出处理技术比较复杂,散列方法与键值分布有关,要求等长记录,只能通过记录的关键字寻址 散列函数: 质数除余法、平方取中法、 折叠法与移位法 多重表文件 记录之间互相用指针连接的文件,每个记录组成:信息域+指针域 结构上具有很大的灵活性 指针占用存储空间,需要建立次关键字索引表 链:单向链、双向链 环:单向环、双向环 倒排文件 建立非主关键字与记录地址的索引表 。 具有存储的相对独立性,可以提高对具有某一属性的目标的检索速度 检索速度相对于多重表文件慢,多一个键值转换步骤以获取记录号。 又称次索引表、变长向量表。 二、数据模型 数据建模的意义 现实世界—〉信息世界—〉数据世界—〉信息分析—〉现实世界 抽象过程 应用过程 数据模型 模型:是现实世界的本质的反映或科学的抽象,反映事物的固有特征及其相互联系或运动规律。 数据模型:是数据库中关于数据和联系的逻辑组织的形式表示,以抽象的形式描述一个部门或系统的业务活动与信息流程 联系:是两个数据集合之间的映射或连接。 数据模型是一种较高层的数据描述,它是独立于任何DBMS的。 层次模型、网络模型——〉关系数据模型——〉多介质数据库 层次模型( 树结构模型) (1)有且仅有一个结点无双亲,这个结点称为树的根; (2)其他结点有且仅有一个双亲结点。 物理实现: (1)物理邻接法 这种方法就是将各层次上的记录按从上到下、从左到右的顺序依次记录在存储器上。 A1 B1 C9 C2 C13 B2 C14 B3 C5 C16 (2)表结构法 可采用子女指针、双亲指针、子女+兄弟指针表示层次结构。 (3)目录法 采用目录文件保存原数据文件中各记录类型和各记录之间的联系。目录的优点是查找快,处理增删也比较方便。 (4)位图法 位图可看作目录的一种特殊形式,它是一张二维的表格,纵横表头是不同层次上的记录键值,若某两个记录间有父子联系的,则在其交点处置1,否则置0。当记录数目不多时,位图表示法比较紧凑。 网状模型 可以有1个以上的结点无双亲;至少有一个结点有多于一个的双亲。 物理实现: 变长指针法、目录法、位图法 网状模型的优点:能够反映现实生活中极为常 见的多对多联系。 缺点:数据结构本身的复杂性 关系模型 是以集合论中的关系概念为基础发展起来的,用二维表的形式表示实体和实体间联系的数据模型。 元组:每个实体所对应的表中一行; 域:表中的每一列表示同一种属性,称为域; 主关键字:把凡能唯一标识元组的关键字称为候选关键字,从中任选一个来标识元祖的称为主关键字。 外关键字:如果公共关键字在一个关系中是主关键字,那么这个公共关键字被称为另一个关系的外键 关系模型的规范化:1NF——〉2NF——〉3NF 关系模型的优点:简单易行,使用与维护均很方便。 缺点:表示复杂关系较为困难;当数
文档评论(0)