种基于XLCA的XML关键字搜索方法.pdfVIP

下载本文档

3
0
约1.89万字
约 5页
2017-08-20 发布于河南
举报
版权申诉

种基于XLCA的XML关键字搜索方法.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

种基于XLCA的XML关键字搜索方法

小型微型计算机系统 2008年 1月第 1期 JournalofChineseComputerSystems Vo1．29 No．1 2008 一种基于XLCA的XML关键字搜索方法许建军，汪卫，施伯乐 (复旦大学计算机与信息技术系，上海 200433) E—mail：xjj@fudan．edu．cn 摘要：关键字搜索是大多数普通用户搜索信息的有效手段，因为@-A．ll不需要学习复杂的查询语言，也不需要了解底层数据的结构．本文研究了针对XMI文档的关键字搜索问题，首先指出前人基于 SLCA 的结果集定义的不完备性，进而提出基于 XL— CA 的结果集定义，使得其能够包含所有可能的结果．基于这样的结果集定义，给出了一种精简的索引结构以及相应的搜索算法，并实现了这两种不同的方法，实验证明本文提出的方法在性能以及可扩展性方面均有较大的提高．关键词：关键字搜索；XLCA；杜威编码中图分类号：TP311．13 文献标识码：A 文章编号：1000—1220(2008)01—0052—05 An XM L KeywordSearchM ethodBasedon XLCA XUJian—jun，WANGWei，SHIBo—le (DepartmentofComputerandInformationTechnology。FudanUniversity，Shanghai200433，China) Abstract：Keywordsearchisaneffectiveapproachformostuserstosearchforinformation becausetheydonotneedtolearn complexquerylanguages，orknow theunderlyingstructuresofthedata．ThispaperfocusesonkeywordsearchinXM L EqU- ments．ItfirstpointsoutthedefinitionoftheresultsetbasedonSLCA isnotcompleteandthendefinestheresultsetofXML keywordsearchbasedonXLCA ，whichcanincludeallthepossibleresults．Basedonsuchdefinition，itpresentsacompactj】一 dex structure and the corresponding search algorithm ．Two searchmethodshavebeen implemented and the experiments demonstratethebenefitsofourmethodoverpreviouslyproposedmethods． Keywords：keywordsearch；XLCA ；deweynumbering 1 引言何语义信息，因而很难对其进行分割，而且通常HTML文档 ● 的规模都不大，直接返回这样的文档给用户也是可行的．而关键字搜索 (KeywordSearch)是现今最为流行的信息发 XML文档中的标签具有一定的语义信息，它指出其所包含的现方法，因为用户不需要学习任何复杂的查询语言，也不需要数据的含义，这样就使我们可以不返回整个文档给用户，而只了解底层数据的结构．著名的搜索引擎Google就是针对万维返回与用户提交的关键字相关的XML文档片断．在XML关网上HTML文档集的关键字搜索，用户只需在简洁的界面上键字搜索中，返回结果的粒度由XML文档精细为XML文档输入若干关键字，Google就能够返回所有包含这些关键字的片断，这称为结果粒度精细化．结果粒度精细化对于搜索大型 HTML文档．这种搜索信息的方法大大方便了初级用户在浩 XML文档是