提高信息检索性能有效机制与算法研究.pdfVIP

提高信息检索性能有效机制与算法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要 摘要 随着互联网的飞速发展,以电子形式存在的信息大量增长,在给用户带来更多可获 取的信息的同时,也给用户获取这些信息增加了难度。如果没有合理的信息检索手段, 人们很难充分利用这些信息。 信息检索技术可以帮助人们从大规模的文本数据中获取所需要的信息。而WEB信 息检索又同传统的信息检索不同,WEB的呈现方式与普通文本有区别,同时WEB还有 自身的拓扑结构。在参加文本检索会议 TREC 的过程中,我们对如何利用这些WEB的 特性来对传统的信息检索技术进行改造进行了研究,并取得了一定的成果。由于在自然 语言理解上尚无法取得突破,计算机_还仅能从用户提交查询中关键词的有无来判断是否 相关,检索系统不能智能的判断文档的相关性,使得用户构造查询的难度也大大增加。 反馈可以帮助系统对用户的查询进行改造,目的是更精确的描述用户的需求。伪相关反 馈是指无需用户参与的一种反馈方法。伪相关反馈实际上是一种统计方法,利用它可以 自动调整查询计算模型的参数,也可以对查询特征进行更精确的扩展。我们首先通过对 影响反馈性能因素的研究,得到稳定的参数调整方法,并提出了一种动态调整反馈参数 的构想。同时,用户的查询输入是需求的简单表述,我们利用互信息作为查询扩展时特 征选择的依据之一,降低反馈后查询的不确定性,从而达到提高反馈性能的目的。这种 方法在TREC2002主题提取子任务中取得了不错的效果,跟传统的反馈算法相比有较大 的提高。 关键词:信息检索,WEB检索,伪相关反馈,互信息 提高信息检索性能的有效机制与算法研究 of the ofWEBInformationRetrieval Studies Performance Enhancing Algorithms Zhe InformationRetrieval Yang Directed ByChengXueqi ashuman and Webinformationis accumulates nowadays knowledge avalanching canbe network bccome ismoreinformationthat acquire, applicationspopular.Them people make andmore comeswhenwantto theuseful Callnot difficulty they get information.People oftheinformationwithout facilities. usC goodsearching effectively in oftext Information search amounts help large retrieval IR technology伽lpeople hasits WEB textonthe the data.ButWEBinformationisunlikecommon mode,and display studiedhowtousethecharacterofWEBto the own structure.We improve topology theWEBTracktaskof traditionalinformationretrieval on TREC2003,and algorithms got nature nosolventonthe of someachievementonit.Since language,the perception computer in in thewordsuser’s thedocument. can the whether relativity appear onlyjudge by query to can work makeitdifficulttheusers Therelrieval not intelligently,whichf.Or system can the to their relevancefeedbackmethod retrieval construct help system query.Thepseudo of the user’s amore user’s rebuild precise requirement.Butpseudo query.for description how the thatthaTea to relevancefeedbackmethodisastatistical is one,so problemoptimize he in tofinda studiedthefactorsthatinflu∞cefee

文档评论(0)

ltt20083 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档