基于MarKov团的信息检索扩展模型-计算机科学与技术专业论文.docxVIP

  • 1
  • 0
  • 约3.99万字
  • 约 59页
  • 2019-02-13 发布于上海
  • 举报

基于MarKov团的信息检索扩展模型-计算机科学与技术专业论文.docx

基于MarKov团的信息检索扩展模型-计算机科学与技术专业论文

4,7,· 摘要信息检索过程中最重要的环节就是检索出与用户需求相关的内容。其核心问 摘要 信息检索过程中最重要的环节就是检索出与用户需求相关的内容。其核心问 题就是:对于给定的用户查询,对文档集中的每个文档与查询进行相关性判断。 ◆ 在这一过程中,查询表达了用户的信息需求,是信息检索过程中最为关键的数据 之一,其内容准确与否直接关系到检索结果的好坏。但是,由于查询词简短且存 在一词多义和一义多词的现象,往往会造成用户查询与数据不匹配,导致检索结 果不佳。一种常用的解决该问题的方法是对查询进行处理,使查询更好的表达用 户的意图。 目前,在搜索引擎中比较常用的查询处理方法有相关反馈和查询重构及自动 查询扩展技术,而自动查询扩展技术按照使用到的文档集不同,又可分为局部分 ■ 析方法和全局分析的扩展方法作为较早出现的具有实际应用价值的查询扩展方 法,全局分析方法得到了广泛的应用。 传统的全局分析方法在提取扩展词时,没有充分考虑到扩展词间的间接关 系,这势必会影响到检索性能。本文提出了一种基于Markov团的信息检索扩展 模型,本文使用到了基于团的提取算法,团结构描述了Markov网络中多个词之 间构成团的深层次关系。在计算相似度时,本文利用到了Markov网络的性质进 一步表示了词间的间接关系,提高了检索性能。 本文首先通过计算词间相似度构造Markov网络模型;然后由此模型加强候 选词集中词相关性描述,并提取了在Markov网络中词间的团结构;最后通过在 ◆ 查询中加入查询词所在团中的其他候选词进行查询扩展。在5个常用的标准测试 集ADI、C删、MED、CISI和CRAN文档集上的实验表明基于Markov多步转移 相似性的信息检索模型的检索效果优于基于一般的相似性矩阵查询扩展的检索 效果;基于团提取方法的查询扩展的检索效果优于普通的基于提取方法的查询扩 展检索效果。 关键词:信息检索查询扩展全局分析Markov网络团 ? tI ? iS iS too short or some other reasons,the search results usually very poor.A common solution is to treatment the query.This solution makes the query better express the users intent. Current.the most commonly me恤ods used to treatment the query are relevance feedback,query reconstruction and automatic query expansion.According to document sets,Automatic query expansion technique divided into local analysis method and global analysis method.As an early appeared query expansion method. Global analysis method has been widely used. The traditional global analysis method didn’t take the indirect relationship between words into account.This paper proposes an information retrieval model based on Markov cliques,we used the extraction algorithin based on clique extraction method,the clique describes the deep-rooted relations between the terms. Moreover,we used the Markov network model to further express the indirect relationship between words. In this paper,we first build a Markov network model,which is constructed by calculating the similarity between terms,and strengthens the description of relationship between candidate terms.Then,we extracted Cliques from Ma

文档评论(0)

1亿VIP精品文档

相关文档