网站大量收购独家精品文档,联系QQ:2885784924

半结构化数据查询语言--Lorel.pdfVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
半绻悔亿数簟壹黼盲叫删 哨聩昭随工大掣疆睢口I群院,南京·21∞16,w如岫j∞@吐1“锄 “解救辊工大学州釉徙浦挥自动化学院州收帖捕挥自;眦系,南京21∞16 冀耍:奉文对L耐语言的特性及其与oQL语言的差异进行了棵人的分析。结果表明:L删语言在查铷半结构化数据方面 具有巨大的优势。 , v 关幢词:L删,半结构化数据,0删 A semi-s缸删咖lH!d咖~-I蒯 QueryLan罂隐嚣of Song盈irI w砸嘶LLnJi删i越lg 璜柙血瑚tofcc衄科衄sdm∞柚a曲衄锄d 舢—嘣:1k qua唧雌靶向。s帅a州data一 印呲,删恤霉锚in 1.引言 sOL语言自诞生以来得到了普遍的应用,成为了关系数据库的标准语言。随着“后关系时代”的来 数据模型的数据库,即它们面向的数据是结构化的、有组织的。但是,随着h忱met的飞速发展,这种应 用环境已经发生了巨大的变化。目前,查询语言所面对的数据已经不再是结构化的数据,而是半结构化 数据(∞墒舡l】咖刚da纽)口这种数据不再与关系数据库和面向对象数据库中的数据—榉有严格的、完整 的结构。因此,对半结构化数据的查询必须使用一种新的查询语言。knl语言就是美国斯坦福大学为此 目的而研究开发的一种查询语言。它采用人们所熟悉的sQL语言的风格书写,从数据模型和语言功能上 语言的新特性出发,对这两种语言的不同之处进行了深人的研究。 LD耐语言所面对的数据是缺乏严格、完整结构的半结柯化数据。半结构化数据是介于无结构数据(如 自然语言)和结构化数据(如关系数据)之间的一类数据。这类数据并非毫无结构,但它们的结构可能 是隐含的、不完整的,甚至可能是需要不断惨改的。在集成多个异类数据源时,尤其是在集成网上得到 饼§ 第七届联合国际计葬辅台议论文集 的大量格式不同的数据,甚至是信息不全的数据时,“半结构化”概念的提出是非常有用的。但如何描述 这些半结梅化的数据昵?本文采用了一种极为有效的数据模型:oEM。 在oEM模型中,数据的组织可以看作是一张豳,它由节点和带标签(1捌)的边组成。所有的实体 都是对象,位于节点处,边表明对象之间的联系。对象以唯一的对象标识符(oid)来表示,分为原子对 象和复合对象。原子对象仅含有—个原子型的值,例如:整型、实型、字符串型、gif型、抽叫型、m抽 为字符串型。 图l即是—个简单的oEM数据库,名字为G试de。它包括—个根对象和它的三个子对象,对象标识 它们只吉有一个原子型的值。 一哪mg 6668800 图l 0删嬲眸 由图l可以看出0EM模型不具有严格的结构:(1)图l类似于一个树图,但它允许存在对象间的循 且每个地址对象既可以是原子对象,又可以是复合对象;(3)邮或编码(卿ode)对象既可以是地址对 象豹子对象,又可以直接作为商橱(s蛳e)对象的子对象,并且它的值可以是整型,也可以是字符串;(4) 的组织上具有极大的灵活性,对于表示结构上不严格、不完整的半结构化数据有着非常有利的条件。因 此本文采用0EM作为半结构化数据的模型。 半结构化数据不具有严格的结构,因此蝴oQL语言对之进行查询时必然会出现错误。例如在图 中这一点,则采用oQL的查询为: ∞KtX.ad山℃站 · 缸粕Guide.s咖e】(兄五pcodeY wlkre Y=2l㈣ 这个查询城表匿上来看是正确的,是符合人们的语言习惯的,但实际上它却存在这样的同题:(i)Y 查询不能进行

您可能关注的文档

文档评论(0)

bhl0572 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档