文献检索与利用课件65425.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
误检的改进措施 漏检的改进措施 操作型对策 限定为主要的标引词 加入分类代码或范畴代码 采用字段限制 施加语种、出版年代等限定 更多地使用位置逻辑算符 运用更严格的位置逻辑算符 补充足够的同义词 把叙词作为紧邻关键词使用 选用登录数高的索引词 取消各种检索限制和限定 运用更宽松的位置逻辑算符 概念型对策 以AND加入相关检索词 用NOT排除无关概念 采用下位叙词 采用下位类 对泛指概念加以具体化 以OR加入相关检索词 以OR加入所有的下位叙词采用上位叙词 采用上位类 排除数据库中的普遍概念 3.6 计算机信息检索的运行步骤 (1)主机检索算法的处理运行 数据库的检索算法可分为顺序检索和倒排文档检索两种。顺序检索将检索提问标识依次与文档中的各条记录进行比较,必须检索整个文档后才能得到检索结果。这种算法在逻辑和执行上都较为简单,但每次检索都需要查找整个文档中的所有记录,查找量大而速度慢。脱机信息检索系统就采用这种算法,为提高检索工作效率,每次操作都处理一批提问,因此也被称为批处理系统。显然,这样的检索速度无法满足联机信息检索的需要。 倒排文档检索首先从词典文档中查找和对比检索提问标识,获得含有该标识的记录数量, 再根据关联指针,得到有关记录的存取号及其字段位置,然后按检索提问式的逻辑关系进行运算,得到命中的记录存取号的集合,最终根据存取号从主文档中调取有关的记录进行输出。这种算法虽然在逻辑和执行上较为复杂,但与联机数据库的文档结构相适应,可以显著地减少要查找的记录数,极大地提高主机的响应速度,满足实时(Real Time)检索的联机需要(见图 )。 第一篇 内容小结 信息检索的概念与类型 信息检索的原理 信息检索语言 信息检索的方法与途径 信息检索的过程与策略 信息检索的发展趋势 计算机信息检索的检索技术 计算机信息检索的步骤(检索式的构造) 计算机信息检索策略及策略模式 计算机信息检索的运行步骤 为什么要学习信息检索 返回 信息爆炸、信息泛滥 信息的海量性\无限性与人的时间精力的有限性之间的矛盾 信息时代的基本要求 我们淹没在信息中,但是却渴求知识 ----美国未来学家奈斯比特《大趋势》 信息爆炸 现在一年全世界所产生的新信息量大约有 4千万万亿 字节 引自 Howwie Diblasi 的“你知道吗?” 2013年全球信息总量突破: 1.9千万亿兆 字节 这超过了人类过去五千年的信息量总和! 大数据的海啸······ 3.布尔逻辑检索(Boolean logic searching) 布尔逻辑检索是多个检索项(可以是单词、词组或检索式)之间通过运用布尔逻辑算符来准确的表达检索提问的检索技术。 (1)布尔逻辑算符 共有逻辑与、逻辑或和逻辑非三种:分别表示概念之间的相交关系、并列关系和排斥关系,以 AND、OR和 NOT来表达。 逻辑“与”----AND 或 * 用于交叉概念或限定关系概念之间的组配,可以缩小检索范围,提高检准率。 它所连接的两个检索词必须同时出现在检索结果中才满足检索条件。 逻辑“或”----OR 或 + 用于并列关系的概念组配,相当于增加了检索词主题的同义词或近义词,有助于扩大检索范围,提高查全率。 它所连接的两个检索词中任何一个出现在检索结果中就满足检索条件。 逻辑“非”----NOT 或 – 用于排斥与选择关系的组配,能够缩小命中文献的范围,增强检索的准确性。 表示它所连接的两个检索词中,应从第一个概念中排除第二个概念。 逻辑“异或”----XOR 或⊕ (含有一个的命中,两个同时包含的不算命中) (2)布尔逻辑算符的运算次序及使用注意事项 不同的检索系统有不同的规定; 关于“或”逻辑的使用:如果检索词涉及到表达整体的概念,就要针对具体情况分别列出每一个部分概念的检索词,否则将出现漏检。例如:检索有关欧洲专利方面的文献 关于“非”逻辑的使用一定要慎重。例如:检索计算机软件方面的文献, 例:要实现“北京除冬季外汽车和可吸入颗粒物造成的空气污染状况”这一主题的检索。 4.截词检索(Truncation searching) 截词检索是单词的部分相等匹配,就检索词与标引词进行片段的比较运算。即在检索词的某个局部截断,利用检索词的词干或不完整的词形加上截词符号所进行的检索。尤其在西文检索中普遍使用。其目的是方便查找某一词干的不同变化形式,使“一词”多用,防止漏检,提高查全率。 按截断的位置分,可有后截断

文档评论(0)

ldj215323 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档