- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
几种信息检索模型比较解读
几种信息检索模型比较解读
PAGE / NUMPAGES
几种信息检索模型比较解读
几种信息检索模型比较
纲要:对信息检索模型研究的主要内容和建立策略进行了描绘,给出了几种常用的信息检索模型有关性算法,剖析了它们的优弊端,并就存在的问题进行了商讨,总结了信息检索模型的研究现状和发展趋向。
重点词:信息检索模型;有关性;查问;搜寻引擎
Abstract:This article described the main contents and the construction strategy of the models of information retrieval,demonstrated a lot of methods in common usages,which is to calculate the model of information retrieval.And in this article,the advantages and disadvantages were analyzed,the problems that is still existing have been researched.In addition,the current situation of
this research and the development tendency of the model of information retrieval were deeply summarizad in this article.
Keywords:Information retrieval models;Relativity;Inquiry;Search engine
目前,跟着互联网的普及和网上信息的爆炸式增加,信息检索系统及其核心技术搜寻引擎的性能和效率问题已成为人们研究和关注的焦点。影响一个搜寻引擎系统的性能有好多要素,但最主要的是信息检索模型,其研究内容包含文档和查问的表示方法、评论文档和用户查问有关性的般配策略、查问结果的排序方法和用户进行有关度反应的体制。本文从研究文档与用户查问“有关性”般配的角度出发,对信息检索模型研究的主要内容和建立策略进行了详尽的描绘,并给出了几种常用的信息检索模型有关性算法,剖析了它们的优弊端及存在的问题,总结了目前信息检索模型的研究现状和发展趋向,其目的在于提升信息检索、查问的性能和效率。
一、建立信息检索模型的策略
目前,建立信息检索模型的主要策略有以下两个:
(一)通用的信息检索模型
建立一个通用的信息检索模型,研究优化的般配算法,提升查问速度、查全率和查准率,最大程度地知足一般用户的查问需求。
(二)用户兴趣模型
依据特定用户查问兴趣要求建立用户兴趣模型或共同兴趣模型,能够尽可能地知足特别用户查问的需求。它能够建立一个合适行业或专业应用语义要求信息获得模型。如 谷歌 就能推测用户的使企图图,供给动向的、即时的用户“个性化定制”信息,帮助用户迅速、正确地定位到所需要的信息。
二、常用的信息检索有关性算法
(一)布尔模型
布尔模型是鉴于特点项的严格般配模型,文本查问的般配规则依据布尔运算的法例。用户能够依据检索项在文档中的布尔逻辑关系提交查问,搜寻引擎则依据预先成立的倒排文件构造,确立查问结果。标准的布尔逻辑模型为二元逻辑,所搜寻的文档要么与查问有关,要么与查问没关。查问结果一般不进行有关性排序。
在布尔模型中,一个文档经过一个重点词条的会合来表示,这些词条都来自一个字典。在查问与文档般配的过程中,主要看该文档中的词条能否知足查问条件。布尔模型用文档的检索状态值作为一种评论查问和文档相像性的一种方法。这里,第一定义重点词会合 S,重点词为 t1 ,t2 ,, , tn 。
这些重点词能够和逻辑操作符 AND,OR和 NOT形成不一样的条件查问。假如获得条件表达式的值为 True ,该文档有关于此条查问的检索状态值为 1;假如若干文档有关于此条查问的检索状态值都为 1,则能够以为,这些文档与此用户的查问是有关的。
布尔模型的主要长处有两点:一是实现起来比较简单,速度快,计算的代价相对较少。二是查问语言表达简单,用户能够使用随意复杂的查问表达式,易于
表示同义关系 ( 如:聋教育 OR特别教育 ) 和词组 ( 如:计算机 AND基础 AND课程改革 ) 。它的弊端是,因为全部检索到的与用户查问条件有关的文档拥有同样的检索状态值,则不可以对查问结果依据有关性进行排序;此外重点词也没有考虑
权重的影响,缺少定量剖析和灵巧性以及不可以表述模糊般配。而为了战胜布尔型信息获得模型查问结果的无序性,在查问结果办理中引进了模糊逻辑运算,将所检索的数据库文档信息与用户的查问要求进行模糊
您可能关注的文档
最近下载
- AB-罗克韦尔PowerFlex755变频器操作说明.pdf
- 2024-2025学年初中信息技术(信息科技)青岛版(2024)第一册教学设计合集.docx
- ANSI-ESD S20.20-2021电气和电子零件装置和设备的静电保护.pdf VIP
- 养鸡创业计划书3篇农村养鸡创业计划书范文.pdf VIP
- QGDW11190-2014农网高过载能力配电变压器技术导则.pdf VIP
- 全国市政排水管道工程施工质量通病的防治.pptx VIP
- 财务报表词汇-中英对照.docx VIP
- 2025至2030中国冬虫夏草行业市场发展分析及趋势前景与行业项目调研及市场前景预测评估报告.docx VIP
- 治具设计完整版.pptx VIP
- 广西壮族自治区南宁市2025年八年级下学期期末数学模拟试题九套含答案.pptx VIP
文档评论(0)