- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索效率的探讨
摘要
在信息技术迅速发展的推动下,传统信息服务机构和网络信息服务运营商逐步走上由信
息服务向知识服务的转型之路。 在这种趋势下, 信息检索也由过去单纯的字符匹配逐步转向
面向内容、 基于知识的信息检索。 在这里简单探讨一下基于知识服务的信息检索效率的基本
概念和评价指标, 剖析语义分析程度、 信息模型、检索方法和信息收录范围等主要影响因素,
最后通过一个实例,对比分析说明知识服务将提高用户信息检索的效率。
关键词 :知识服务;信息检索:效率
引言:进入知识经济时代,知识管理、知识服务的理念得到广泛认同,信息
检索技术也由基于关键词的信息检索逐步转向针对文章内容的基于知识的信息
检索。后者不再是基于字符的机械匹配, 而是更强调语义, 模拟人类的思维方式,
从语义和概念出发, 自动分析信息资源的语义信息, 查找和发现具有相关知识单
元的信息资源。 较之前者, 其检索结果更准确, 更贴近用户需求。 信息检索是将
信息按照一定的规律组织起来, 找到所需信息的过程和技术, 简单的说, 就是信
息的有序化识别和查找。 信息检索效率就是实施识别和查找过程的效率。 信息检
索效率不仅是影响信息检索工具价值的重要因素, 也是评价信息检索技术发展的
重要指标。
1、基于知识服务的信息检索效率的主要评价指标有检全率、检准率、友好
性和检索耗时。
1.1 、检全率
检出相关信息的记录数与系统中全部相关信息的记录数之比。 这里的相关信
息是指具有语义联系的信息。
1.2 、检准率
是指检出相关记录数与检出全部相关记录数之比。
1.3 、友好性
对检索结果按照相关度进行排序, 便于用户率先查看相关度高的结果再看相
1 / 6
关度低的结果,减少用户定位到目标结果的耗时。
1.4 、检索耗时是指从用户提交请求到计算机返回检索结果所消耗的时长,
由网络速度和检索算法决定。
2、影响因素分析
基于知识服务的信息检索是建立在语义理解基础之上的智能检索过程, 影响
检索效率的因素主要有语义分析、 信息模型、 检索方法和信息收录范围, 分述如
下。
2.1 、语义分析程度
2.1.1 、语义分析
语义分析是在提供信息检索服务之前, 对收录信息资源进行语义层面的分析,
发现和标记信息资源的知识单元及相互联系, 构建基于信息资源本质内容的知识
库。语义分析的目的在于控制检索的语义范围, 从而控制检索的范围, 保证检索
出全部与某特定学科内容相关的信息, 剔除所有与此学科内容不相干的信息。 可
以说,信息检索的范围与语义分析的程度息息相关, 语义分析程度越充分, 发现
的知识单元越丰富,检索结果越全面、准确;反之,语义分析程度不够,能够发
现和标记的知识单元就相对较少,检全率和检准率都会降低导致检索效率低下。
2.1.2 、语义分析的内容
针对信息资源内容的语义分析包括两个方面: 基于内容的定性分析和定量分
析。基于内容的定性分析是对信息内容的学科属性进行分析和鉴定。 通过语义分
析,确定信息所属范畴, 从而限定了信息检索的范围。 目前定性分析的方法主要
有专家法和机器学习法。 基于内容的的定量分
原创力文档


文档评论(0)