- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
改善信息检索效果的途径,信息检索途径,信息检索的途径,信息检索效果评价包括,信息检索效果评价,信息检索效果评价指标,检索途径,检索途径是什么,文献检索途径,检索途径有哪些
情报杂志 2006 年第 4 期
·情报检索 ·
改善信息检索效果的途径
沈 建 人
(南京邮电大学 南京 2 10003)
摘 要 给出了信息检索的形式化表示 ,并在此基础上进行了形式化推导 ,从理论上得出了改善信息检索效果的两大
途径 :优化查询项 、优化相似度计算方法 ,对改善信息检索效果和信息检索系统的设计开发有很强的理论指导意义 。
关键词 信息检索 查准率 Ad - Hoc 查询
非结构化信息、半结构化信息 日益增
加 ,人们对这些信息的需求也不断提高 。因
此信息检索在社会生产生活中扮演着越来
越重要的角色 。改善信息检索效果也就显
得尤为重要 。本文分析了信息检索的流程 ,
给出了改善信息检索效果的理论指导 ,并在
此基础上具体讨论了各种可行的改善途径 ,
具有很强的现实意义 。
1 信息检索流程分析
要改善信息检索的效果 ,首先要确定用
于评价检索效果的标准 。迄今为止 ,普遍使
用查准率和查全率作为信息检索效果的评
价标准 。效率也可作为检索效果的评价标
准之一 。
在确定信息检索效果评价标准后 ,所需
做的是研究信息检索的整个流程 ,找出在检
索过程中尚可加 以改进的地方 , 改进之 , 借
以改善检索效果 。
在信息检索中,用户首先明确所需检索
的信息 ,然后给出相应的查询项 Q ,将 Q 输
入检索系统相应的人机界面上 。接下来 ,系
统对 Q 作一定的预处理后 ,按某种或某几种
策略将 Q 与系统文档库中的文档一一比较 ,
如果系统发现某篇文档跟 Q 很相似 、相关性
很强 ,那么认定该文档为相关文档 ,将它归入相关文档集合 S 。最 图 1 信息检索流程示意图
后 ,系统将 S 中各篇相关文档按相关性大小排序输出到人机界面 只需且必须检索出在文档库中跟查询项相似或相关的文档 。为了
上 , 回馈给用户 。如果用户对检索结果满意 ,那么检索过程顺利结 准确无误地检索出跟查询项相似或相关的文档 ,对检索引擎而言 ,
束 ;如果用户对检索结果不满意 ,那么可以进行重新检索 。其简单 最关键的是选择一种最优的相似度计算方法 ,借以准确量化查询项
( )
的流程见图 1 。图中上半部分的各种操作都是用户发出的 ,下半部 和文档之间的相似 相关 度 。如果查询项和用户所需信息完全一
( )
分的各种操作都是检索系统发出的 , 图中左侧对此作了标示 ,系统 致 ,相似度计算方法对文档和查询项相似 相关 度的测算完全正
人机界面是这两部分的分界线 。 确 ,那么 ,检索结果完全符合用户的需求 ,查准率和查全率都将获得
由此 ,在信息检索中,涉及两个对象 :用户和检索系统 。其中检 最佳值 。
索系统又可以分成两部分 :检索引擎和文档库 。信息检索的实质是 在对检索流程作上述分析后 , 可以抽象出信息检索中的两要
用户借助检索引擎检索出文档库中用户所需的信息 。检索引擎无 素 :查询项和相似度计算方法 。只要保证查询项和相似度计算方法
法直接知道用户需要什么样的信息 。连通用户和检索引擎的媒介 最优 ,最终的检索效果就是关于查准率和查全率最优的。
是查询项 :用户将所需信息表示成查询项的形式 ,检索引擎认为用
2 信息检索的形式化表示与推导
户所需信息和查询项一致 。通过查询项 ,用户将 自己的检索需求告
( ) 上文对信息检索流程作了深入分析 ,萃取出了信息检索行为中
诉了检索引擎 。对于检索引擎 ,在了解用户所需信息 查询项
您可能关注的文档
最近下载
- GB50709-2011 钢铁企业管道支架设计规范.pdf VIP
- 压力性损伤护理与管理能力提升题库答案-2025年华医网继续教育.docx VIP
- 基因多态性与疾病易感性-洞察及研究.docx VIP
- 三位一体煅烧炉生产无水氟化铝工艺说明 .pdf VIP
- 卵巢囊肿蒂扭转急诊护理查房.pptx VIP
- 《中华人民共和国国歌》PPT课件.ppt VIP
- 2025年航空货运行业市场规模及未来五到十年发展趋势报告.docx
- 初中八年级全套体育教案(共36课).docx VIP
- 50045 GBJ45-82 高层民用建筑设计防火规范.pdf VIP
- 股市主力操盘盘 口摩斯密码(原创内容,侵权必究).pptx
文档评论(0)