数据库系统原理-第十一章半结构化数据模型解读.ppt

数据库系统原理-第十一章半结构化数据模型解读.ppt

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第11章 半结构化数据模型 11.1 半机构化数据 11.2 XML Page * 11.1 半结构化数据 半结构化数据SSD 它是一种适于数据库集成的数据模型,即适于描述包含在两个或多个数据库(这些数据库含有不同模式的相似数据)中的数据; 它是一种标记服务的基础模型,用于Web上共享信息。 为何需要半结构化数据模型 可以看成是E/R模型和OO模型的混合 类/联系;类/关系 关系模型成功的一大原因在于它简化了系统的高效实现,而SSD模型的关注原因是灵活性 SSD是无模式的。本身就指明了其模式,且该模式会不断变化 * 半结构化数据表示 SSD的数据库是节点的集合,每个节点都是一个叶子节点或者一个内部节点; 根节点:没有进入的弧,它代表整个数据库,每个节点都从根可达; 叶子节点:与数据相关,数据的类型可以是任意原子类型,如数字或字符串; 内部节点:至少有一条向外的弧,每条弧都有一个标签,指明弧开始处的节点与弧末端的节点之间的关系。 Page * 例11.1 关于电影与影星的半结构化数据库 Page * SSD表示 Root节点:有出无入 每个节点都可从root到达,但这个图未必是一棵树 其中的cf/mh/sw是三个逻辑节点,即只是为了表示和引用方便,本身不属于数据库; 从节点N出发到达节点M的弧上的标签L可担任下面两个角色之一: N表示的是一个对象或实体,而M表示N的一个属性,那么L表示该属性的名字; N和M都是对象或实体,L就是从N到M的一个联系的名字。 例11.2。注意cf到name/address的弧标签是属性名;address到street/city的弧标签是域名;cf到sw的弧标签是联系名 Page * 信息集成与半结构化数据 SSD模型是自描述的,模式与数据附着在一起 每个非根节点的入弧的标签表示该节点在弧起点节点中的角色(属性/域/联系等) 将SSD的特点应用于信息集成 同时访问多个数据库,例如合并多个库中的数据集,如果这些数据库的模式一致,则元组直接合并; 信息集成中需要解决数据的异构性 数据模式:如图11-1中影星的地址 数据模型:关系模型、面向对象 如果模式不同,且合并要考虑遗留数据库问题 数据库一般是持续运行的,不允许因为要复制数据到另一个数据库而将其关闭(即使可以得出从某一模式到另一模式的最有效途径) Page * 信息集成与半结构化数据 异构数据集成的解决方案:外加接口 接口支持SSD,接口导入分布库数据源的数据,转换为作为中间数据的SSD并存储; 数据库中的源数据通过wrapper/adapter组件的翻译功能进行转换。图11-2 另一种解决方案 接口只负责将查询传递给数据源,并返回在数据源中相应模式的引用(接口最后只保留一些指针) Page * 例11.3 例子描述中两个影星数据来自不同结构(模式)的数据库。要进行跨库查询则有两种可能 通过第一种接口将数据库物理合并为SSD形式再进行查询 将查询分别传递给两个库,各自完成具体查询工作后向接口返回引用指针。后继应用需要具体结果时可根据引用指针取到值 习题11.1.5。UML模型和SSD模型的本质区别? SSD中的节点表示实体,UML中的节点表示实体集 Page * 11.2 XML 什么是XML(Extensible Markup Language)? XML是一种元标记语言,可以定义特定领域内的标记语言的语法结构。 XML与HTML不同在于可扩展性,XML不象HTML那样,提供了一组事先定义好了的标记,而是提供了一个定义标记的标准,利用这个标准,用户可以根据实际需要定义自己的标记。此外更重要的是,XML描述的是结构和语义而不是格式。 介绍XML的目的 XML在HTML的数据内容表示基础上,进一步描述了文档内部信息之间的层次关系 XML的基本原理与前一节中的SSD相同,特别是XML中标签的功能与SSD中的弧功能相同 这些相似性特点使得XML成为SSD模型的一种典型实现 Page * 语义标签 用尖括号括起来的文本,往往成对出现,称为开始标签和结束标签; FOO…/FOO 标签之间可以出现包含文本和嵌套标签,一对匹配标签和出现在它们之间的一切内容称为元素; FOOhello!/FOO addresscityNewYork/city/address 非成对标签不能包含任何元素或文本,但可以有属性。 FOO/ Page * 有模式和无模式的XML 格式规范的(Well-Formed) 格式正确的XML文档遵守XML语法,但没有文档类型定义DTD(Document Type Definition)或模式定义。 合法的(Valid) 包括一个DTD(文档定义类型),它定义

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档