数字信息检索与利用复习资料.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字信息检索与利用复习资料

信息检索的概念、类型? 广义的信息检索是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。狭义的信息检索是指从存储的信息集合中快速获取各种需要的信息。 信息检索全称:信息存储与检索 。 存储是基础,检索是目的 类型:1、按照检索对象的不同,早期信息检索分为: 1文献检索:以文献为检索对象的一种相关性检索。 2事实检索:检索结果是事实结论的信息检索(确定性检索)。 3数据检索:检索结果是数据的信息检索(确定性检索)。 2、新的三分方法:文本检索、数值检索、声频与视频检索。 阐述信息检索的基本原理? 是对信息集合与需求集合的匹配与选择。通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。 含义:检索语言是应文献信息的加工,存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。简言之,检索语言是用来描述信息源特征和进行检索的人工语言, 作用:(1)标引文献信息内容及其外表特征,保证不同标引人员表征文献的一致性; (2)对内容相同及相关的文献信息加以集中或揭示其相关性; (3)使文献信息的存储集中化,系统化,组织化,便于检索者按一定的排列次序进行有序化检索; (4)便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性 ; (5)保证检索者按不同需要检索文献时,都能获得最高查全率和查准率。 1、工具法又称常用法,是指直接利用检索系统(工具)检索文献信息的方法。它又分为顺查法、 倒查法和抽查法。 (1)顺查法由远及近。适用于。例如,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。 (2)倒查法 是由近及远,从新到旧,逆着时间的顺序的方法。此。 (3)抽查法 2、追溯法 。 综合法循环法分段法。它是分期交替使用。 简述信息检索步骤?(具体例子) (1)分析研究信息检索课题 (2)选择信息检索工具 (3)确定信息检索方法 (4)掌握获取原文的线索 (5)获取原文 (6)用户相关反馈 查全率、查准率、漏检率和误检率的含义?(公式在书上自己抄) 查全率(R),且没有联机帮助,操作界面友好,易学易用。联机信息检索操作复杂,要学习和记忆一系列复杂的检索指令和检索规则,一般用户只能借助专业人员的帮助才能使用。 检索结果 在检索结果方面,光盘信息检索和联机信息检索,检索准确率高,误检率低,查全率低。 检索内容 光盘信息检索信息更新速度慢,一般在个月左右,联机信息检索一般在一周或一个月左右,个别的数据库如新闻类每天更新 讨论联机信息检索未来的发展趋势 三大经典检索模型 布尔检索模型: 一种简单的检索模型,它建立在经典的集合论和布尔代数的基础上。 遵循两条基本规则: 每个索引词在一篇文档中只有两种状态:出现或不出现,对应权值为 0或1。 查询是由三种布尔逻辑运算符 and, or, not 连接索引词组成的布尔表达式。 优点:简单、易理解、简洁的形式化。 缺点:准确匹配,信息需求的能力表达不足。 向量空间模型: 特点:基于多值相关性判断、基于统计学方法的词加权处理模式、采用检索结果的排序输出策略。 3.概率模型基于相关反馈的原理,需要进行一个逐步求精的过程 2

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档