信息收集策略与案例分析.ppt

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2006-05-15 复旦大学图书馆文献检索教研室 第九章 信息处理与分析 第二节 文献检索策略 与案例分析 一、文献检索策略概述 二、文献检索效果评价 三、文献检索策略构建案例分析 一、文献检索策略概述 (一)检索策略的定义 (二)常用的检索策略类型 (一)检索策略的定义 广义的检索策略 指为实现检索目标而制定的全盘计划和方案,是对整个检索过程的科学规划和指导。 具体而言就是在明确检索目的、分析课题特征的基础上,选择合适的数据库和检索系统,拟定检索方案,确定检索词,构建检索提问式,执行检索并调整检索式,直至获得较满意的检索结果的全过程。 检索策略的制定流程 (一)检索策略的定义 狭义的检索策略 特指检索过程中构建检索式的环节 包含检索词的确定,运算符的选择,检索字段的设定及限制选项的设置等。 (二)常用的检索策略类型 积木型(Building Block) 把检索课题剖析成若干个不同的概念面,逐个查找各个概念面 在每个概念面检索时尽可能全地列举同义词、近义词和相关词,用“OR”连接,构成针对每个概念面的检索式,即多个子检索式 最后根据课题要求,选用合适的布尔算符把所有子检索式连接起来,构成一个总的检索式。 这种策略类似把各个积木块拼成完整图案,因此称为积木型检索策略。 (二)常用的检索策略类型 引文珠形增长(Citation Pearl-Growing) 首先检索课题中较为核心的、最专指的概念面,以便至少检出一篇命中文献或相关信息。 浏览检出文献,从中选出新的相关检索词,补充到检索式中,重新检索出更多的命中文献。 然后再重复进行浏览选词再检索的过程,直到获得理想的最终检索结果为止。 这种策略最具交互性,检索词更具针对性,检索式在变化中完善,不足是检索费时较多。 (二)常用的检索策略类型 逐次分馏(Successive Fractions) 先用较宽泛的检索式,确定一个范围较广的命中文献初始集。 然后逐步利用各种检索限制或限定措施,逐渐提高校索式的专指度,缩小命中文献集,直到得到数量适宜、用户满意的命中文献集为止。 这种策略有利于平衡检索的全面性和准确性,如能较好地掌握检索限制和限定的尺度,可取得相当好的检索效果。 (二)常用的检索策略类型 最专指面优先(Most Specific Facet First) 首先从课题中最专指的一个概念面入手检索,得到初步检索结果后再决定是否要加入其他概念面。 这些其他概念面只有在要提高查准率时才需输入,各概念面在检索式中是逻辑 “与”的关系。 如果觉得命中文献太少,通常不需要再把其他概念面加到检索式中去。 这种策略比较灵活,检索用时也相对较少。 (二)常用的检索策略类型 最低登录量面优先(Lowest Posting Facet First) 登录量是指一个索引词在标引中的使用次数 用户在索引词表界面查询课题中每个概念面对应的检索词的登录量,用登录量最少的概念面为入口开始检索。 如命中文献相当少,则完成检索。如结果较多,再选择登录量较低的概念加入到检索式中,逻辑关系为“与”。 这种策略与最专指面优先策略极为相似,不同的是在计算机检索中,很容易明确哪个概念组面的登录最小。 二、文献检索效果评价 (一)查全率 (二)查准率 (三)查全率与查准率的关系 (四)影响查全率和查准率的因素 数据库检索结果距阵 (一)查全率 查全率(Recall Ratio,简称R) 是检索系统中检出的相关文献数量(a)与检索系统中相关文献总量(a+c)的比率,即: (二)查准率 查准率(Precision Ratio,简称P) 是检索系统检出的相关文献数量(a)与检出的文献总量(a+b)的比率,即: (三)查全率与查准率的关系 查全率与查准率之间为互逆的关系 通常采取措施提高查全率时会降低查准率 反之,采取措施提高查准率时则会降低查全率 在检索中很难实现查准率和查全率均逼近100% 在检索中要根据课题的实际需求,确定以查准为主还是以查全为主,或是寻求查准与查全之间的平衡。 (四)影响查全率和查准率的因素 提高检全度的方法 将检索词限定到文摘、全部字段等 使用截词符。如:transplant* 使用同义词。如:(lung cancer or lung carcinoma) 查全同义单词的不同拼写方式 如:fibre or fiber 查全缩写与全称 如:“ang 1 7” OR “angiotensin 1 7” 变词组检索为邻近检索。 如:“acute pancreatitis” 改为 acute adj2 pancreatitis (四)影响查全率和查准率的因素 提高检准度的方法 将检索词限定到标题、关键词字段 设定在数据库的某个或若干个子集中检索 例:core clinical journ

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档