基于Xcluster的XML松弛查询小枝评分方法.pdfVIP

基于Xcluster的XML松弛查询小枝评分方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Xcluster的XML松弛查询小枝评分方法

维普资讯 第 8卷年年1篙10月期 OOMPUTE计RTE算CH机N0U技)G术YA与ND发DEV展ELOPMENT VoO1c.t18No.10 2008 . 2008 基于Xcluster的XML松弛查询小枝评分方法 李建军,杨路明,刘 波,胡智飞 (中南大学信息科学与工程学院,湖南长沙 410083) 摘 要:在Web上精确检索XML代价非常昂贵。为 了缩短操作代价,定义了XML查询松弛的概念,利用三个松弛原操作 对用户提交的查询进行松弛,产生查询松弛集。为了定量衡量松弛的可信度,定义了松弛损率,引入传统信息检索中 TFIDF评分思想,给出了基于文档统计特性和松弛损失的XMLWeb检索的TFIDF评分公式,并实现该算法。一系列实 验表明此方法在 XMLWeb数据检索中具有常数查全率和较高的查准率。 关键词:松弛查询;小枝匹配;TFIDF 中图分类号 :TP311 文献标识码 :A 文章编号:1673—629X(2008)1O—oo53—04 MethodofRelaxationQueriesTwigScoringBasedonXclusterofXML LIJian-jun,YANGLu.ming,LIU Bo,HU Zhi—fei (SchoolofInformationScienceandEngineering,CentralSouthUniversity,Chnag~ 410083,China) Abstract:Inordertoreduceo06tofpreciseXMLretrievalOnWeb,thequeryexpressionrelaxationstrategyispror~ xlandtheocmputing formularforinformationlostrateisdefined.Acocrdingtothis,thet、^rigscoringmethodofXMLfuzzyretfivalbasedonXelusterispro— posedandthe algorithm hasbeenimplemented.Theexprimentresultsshow themethodiseffcetivena dhasthecharacteristicofconstant recallandhighprecision. Keywords:relaxationretrieval;twigmatch;TFIDF O 引 言 简单、操作性强,然而基于路径表达式格式化所提供的 随着XML成为Web电子数据交换的标准逐渐被 Xpath语义松弛非常有 限,不能应对查询多样性的需 推广,越来越多的应用需要在Web上检索 XML数据。 求。文献[4]根据关键词和 Xpath查询轴对 已有的评 然而在互联网上实现 XML精确检索代价非常昂贵。 分方法进行分类 ,通过研究作者说 明现有的 IR— 因此很多学者都提出XML模糊查询。文献[1]运用 c G在索引机制上不能很好地支持既包含结构又包 一 组代数规则对 Xpath轴进行松弛并用 TFIDF评分 含内容的XML评分。文献[5]在文献[4]的基础上区 公式给查询表达式评分 ,力图在保 留所有谓词的基础 别对待查询树中的叶结点和路径结点,将路径作为模 上实现XML模糊查询。此方法能保证最低的信息损 板 ,而叶结点则归为关键词,运用现有的模糊检索技术 失,但是只针对查询轴的松弛导致查询嵌套深度的急 分别实施结构与内容的模糊。其优点是技术成熟、响 剧增加,从而制约查询响应速度。文献[2]的XIRQ引 应速度快,但是拆分

文档评论(0)

wannian118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档