第二讲检索策略在信息资源课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲检索策略在信息资源课件.ppt

制订检索式 检索式是检索策略的具体体现,它控制着检索过程是否合理,关系到能否检索到最相关的信息。针对不同的搜索引擎、数据库以及不同的信息需求,有不同的检索策略,其检索式的构造也不一致,设计合理的检索式成为提高检索质量的关键 用布尔逻辑算符以及一些专门的运算符将各检索单元(主题词或关键词)进行合理组配 检索式的组配常常不是一蹴而就的,需要在检索过程中根据检索的结果不断进行调整,以达到较好的检索效果 最常用的三种检索组配方式: 逻辑与(AND或*)是用来组配不同检索概念,对检索词加以限定,逐步缩小检索范围,可减少命中文献量,提高检索结果的查准率; 逻辑或 (0R或+) 是用来组配有同义或同族概念的词,如同义词,相关词等,可扩大检索范围,达到查全的目的; 逻辑非 (NOT或-) 是具有不包含某种概念关系的一种组配,用来缩小检索范围,可达到查准的目的,但在实际检索时要慎重使用。 南京大学化学系 nanjing university chemistry department Nanjing univ chem dept Nanjing univ dept chem Department, school, laboratry, institute 评估与调整 查全率Recall Ratio 查准率Precision Retio 速度 检索结果过多 检索结果过少 检索结果过多的原因及调整方法 检索结果过多,多数是由误检造成 选取的主题词本身的多义性造成误检 如DNP(邻苯二甲酸二壬酯)可能是DNP动态核极化, DNP糖尿病患者, DNP防老剂, DNP表面活性剂等多种内容,需要进行组配,如DNP*DETERGENT,可排除其他几种含义 选取的主题词的概念范畴太广 需用NOT限制或用下位词 所选用的检索词的截词截得过短 如CAT? 甚至CA? 查找/CATALYST 数据库提供的限制较为宽松也会造成检索结果的过多 这时可采用字段限制,或者限制检索词在指定的基本字段中出现,或者指定辅助字段,或限制结果的文献类型!语种!出版国家等;或用布尔逻辑算符的同时,适当使用位置算符 检索结果过少的原因及调整方法 可能是检索词的选择不合适 可能是检索词的选择不合适,如选用了不规范的主题词或某些产品的俗称,商品名作为检索词,例如:没有使用泡沫塑料或泡沫橡胶,而使用了俗称:海绵,就会造成漏检。这时应采用规范词或增加同义词、相关词、用逻辑或组配后进行检索 同义词没能运用全 查找设备时,只使用了apparatus,而没有使用equipment,和device等词,也会影响查全率。这时可适当增加同义词或同族相关词,用逻辑或组配后进行检索 下位概念未被包括 各种限制过于严格 如果利用跨字段检索,即同时使用题名、关键词和文摘等字段进行检索,然后将它们进行逻辑或的组配,那么可以有效地提高查全率 选用的检索词专指度太高 可适当降低检索词的专指度补充一些同义词或近义词,用逻辑或 影响网络信息检索的因素是多样的,有主观也有客观,网络信息利用者的搜索意识、信息的整合分布情况、检索工具的技术状态等等都直接关系到搜索者的效率。信息检索的途径多种多样,只要我们能针对各种障碍因素选择制定合适的搜索策略,就能让那些主客观的障碍尽可能变小,更有效地利用好网络信息资源,实现自己的各种检索目的。 * 展开,综合数据库,专业数据库,专题数据库,专门文献数据库,说来容易做起来并不简单,转后页例 * 提问,这个题目可以如何做? 展开,分类与主题的概念 * * “石质文物的保护”,可以 “文物* 石质 * 保护”作为检索式,而相关知识告诉我们:一般对于石质文物的保护是采用在文物表面涂层的办法。现在常用的有两类涂层:一类是有机硅涂层,一类是聚酯涂层,所以可将涂层、薄膜这样的隐含概念选出;还可以将硅、有机硅或者聚酯作为概念提出。同样,石质文物也有不少的下位概念,如石楼、石碑、纪念碑、金字塔等。因此检索式可依据具体要求作出灵活的调整。上下位概念的替换是调整检索 * 有些检索词中已经含有的某些概念,在概念分析中应予以排除。如课题玻璃纤维增强石膏制品,从字面上看,这个课题可划分为三个概念即玻璃纤维/增强/石膏制品。但石膏制品中加入玻璃纤维,其目的就是为了增强石膏制品, 因此这一题可提出两个核心概念即/玻璃纤维和石膏制品 一些意义比较泛泛的词需要排除,如发展、进展、技术、工艺等词 确定检索词 表述检索需求的第一步是根据检索需求,形成若干个既能代表信息需求又具有检索意义的概念,包括所需的概念有几个?几个概念之间的关系?概念的专指度是否合适?哪些是主要的,哪些是次要的?力求使所提炼出的主题概念能反映检索的需要。尽量列举反映这些主题概念的语词,供确定检索用词时参考。规范词和自由词是检索常用的语词。对于规范词而言,

文档评论(0)

开心农场 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档