（毕业学术论文设计）-SLCA查询系统.doc

下载文档

2
0
约5.7万字
约 76页
2018-10-10 发布于广西
举报
版权申诉
保障服务

（毕业学术论文设计）-SLCA查询系统.doc

1、本文档共76页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

摘要 PAGE I 摘要 XML(Extensible Markup Language)即可扩展的标记语言，是一套定义语义标记的规范，其目的在于定义计算机和人都能方便识别的数据类型。随着网络应用的快速发展，XML己经被广泛应用到Internet智能信息检索、数字图书馆、数据集成、Web Service等领域，这使得XML类型的数据已成为主流的数据形式，从XML数据中提取有用的信息也就成为了当前的研究热点。目前，XML查询根据查询请求描述特点的不同，可概括为两大类查询模式：XML结构化查询和XML关键字查询。XML结构化查询要求用户必须掌握 XML文档结构及查询语言，这对用户来说有着较大的难度，不易使用。而XML 关键字查询则相对比较灵活，它只需要用户提供简单的关键字信息，而无需懂得任何查询语言或文档结构就可方便使用，因此该模式被广泛采用，有着重要的研究价值。使用关键字检索在万维网中查询HTML文档是证实并且容易使用的一种方法。我们建议在XML文档中使用关键字检索，建模为有标号树，并且描述有效算法。这个被提议的关键字检索返回一个包含所有关键字的最小树的集合，这里的最小树是指它所包含的子树中没有包含所有关键字的树。在这里提出Lookup Eager algorithm算法，利用最小树的关键属性使得当查询包含的关键字有着显著不同的频率时在数量级上超越之前的算法。Scan Eager是ILE、算法的另一个版本适合于关键字有相似的频率。本文也呈现了XML关键字搜索系统，利用ILE算法来实现。关键词　XML关键字查询；最紧致片段；SLCA 燕山大学里仁学院毕业设计（论文）燕山大学本科生毕业设计（论文） PAGE VI PAGE III Abstract XML，stands for Extensible Markup Language，is a standard of semantic markup．It defines the data type aimed at easily recognized by both computers and users．With the fast development of network applications，XML has been widely applied to the Internet intelligent information retrieval system ,digital libraries，data integration， Web Service and SO on，which makes XML become a primary data form．So how to find the useful information from XML data has been a hot research area. According to different features of XML Query request，We Call divide the XML Query strategy into two categories：XML Structural Query and XML Keyword Query．XML Structural Query requests users to master the XML structure and exquisite query language．It is a big challenge to users .However ,XML Keyword Query is much more flexible．Users can easily use it by only providing keyword information instead of any query language or document structures．So this strategy is widely used and valuable to study. Keyword search is a proven, user-friendly way to query HTML documents in the World Wide Web. We propose keyword search in XML documents, modeled as labeled trees, and describe corresponding efficient algorithms. The proposed keyword search returns the se