- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE
PAGE 49
目录
一、引 言 (7)
二、基于XML的Web查询技术研究 (8)
1 Web查询涉及的几个主要问题 (8)
2 Web上的数据模型-XML数据模型 (9)
3 异构数据库的集成 (20)
4 基于XML的Web查询 (29)
三、结 论 (44)
参考文献 (45)
基于XML的Web查询技术研究
一、引 言
随着互联网的普及,网络已成为人们获得信息的主要途径和重要手段网络}资源丰富,闷容庞杂,网络上的数据能否很好地得到共享成为影响网络发展的个重要因素但就目前来看,我们日常用到的数据大部分是无结构的文档和完全结构化的关系数据库中的数据,如果把这些数据放在互联网上很难实现数据的共享为此,必须改变当前数据格式的多样性和共享性差的缺点,用一种统一的数据格式来表示数据,从而实现数据在互联网上更大范围内的共享。如果能够把不同来源的结构化的数据比较容易地结合在一起,将使搜索多样的不兼容的数据库成为可能,从而为解决Web 数据查询难题带来了希望。
XML的出现为解决上述问题提供了理想的解决方案。它是特别为Web应用设计的,它是针对于HTML和Internet 的标准的、可扩展的、通用的数据格式。XML保留了SGML可扩展性、结构性以及数据确认方面的主要优点,它的灵活性允许表示各种各样的信息,而这些信息是自我描述的,所以XML表示的结构化的数据可以被那些没有关于这些数据的知识的软件来处理,实现数据在互联网上更大范围内的共享。XML是一种半结构化的数据模型,XML的文档描述的语义非常清楚,它的可供操作的基础要比HTML好得多,而且很容易就可以将之和关系数据库中的属性一一对应起来,能够支持实施十分精确有效的查询。
本文围绕着基于XML的Web查询技术涉及到的几个主要问题展开研究与讨论:
1.针对Web上数据的自身特点,研究与探讨了适于表示Web上数据的数据模型XML数据模型;
2.为了更好地实现Web数据的共享,本文给出了从关系数据库中结构化的数据向XML格式数据的转换方法,解决异构数据的集成问题;
3. 利用基于XML的查询语言XML—QL实施Web上XML数据源的查询。
二、基于XML的Web查询技术研究
1. Web查询涉及的几个主要问题
Web上有海量的数据信息,怎样对这些数据进行有效的应用成了现今数据库技术的研究热点。所谓数据查询,就是从大量的数据中发现真正需要的内容,解决数据的应用质量问题。如何充分利用有用的数据,废弃无用的数据,是Web数据查询所面临的一个难题。相对于Web的数据而言,传统的数据库中的数据结构性很强,数据为完全结构化的数据,而Web上的数据是半结构化数据。所谓半结构化是相对于完全结构化的传统数据库的数据而言。显然,面向Web的数据查询比面向单个数据仓库的数据查询要复杂得多。Web查询涉及的几个主要问题是:
1.1 寻找一个描述Web上数据的数据模型
Web上的数据与传统的数据库中的数据不同,传统的数据库都有一定的数据模型,可以根据模型来具体描述特定的数据。而Web上的数据非常复杂,没有特定的模型描述,每一站点的数据都各自独立设计,并且数据本身具有自述性和动态可变性。Web 上的数据具有一定的结构性,但因自述层次的存在,从而是一种非完全结构化的数据,这也被称之为半结构化数据。半结构化是Web上数据的最大特点。要解决Web上的异构数据的集成与查询问题,就必须要有一个模型来清晰地描述Web上的数据。针对Web 上数据的半结构化特点,寻找一个描述半结构化数据的数据模型是解决问题的关键所在。
1.2 通过Web上的数据模型实现异构数据库数据的集成
从数据库研究的角度出发,Web上信息的来源主要是从不同的数据库中提取。如果要想充分利用这些数据进行有效地数据查询,就必须解决异构数据的集成问题,用一种统一的数据格式表示数据。只有将各个异构数据源的数据都集成起来,提供给用户一个统一的视图,才有可能从巨大的数据资源中获取所需的东西。
1.3 高效、准确的Web查询
通过使用Web上的数据模型对异构数据进行“改造”,达到数据表示的统一性和一定程度上的结构化,从而实现高效、准确的Web查询。下面就从Web查询涉及的几个主要问题展开研究与讨论。
2. Web上的数据模型—XML数据模型
2.1 结构化数据模型的特点
传统的数据库都有一定的数据模型。描述数据库的数据模型一般是结构化的数据模型,主要分为第一代的层次\网状数据模型、第二代的关系数据模型、第三代的面向对象数据模型。这模型能很好地描述特定的数据,同时可以很好地定义和解释相关的查询语言。
面向传统数据库技术直接应用网络数据的困难在于,网上数据缺乏统一固定的模式,数据往往是不规则并且经常变动,在这种情况下如何来解决异构数据的
文档评论(0)