遗漏隐含概念课题垃圾处理方面-天津大学计算机科学与技术学院.PPT

遗漏隐含概念课题垃圾处理方面-天津大学计算机科学与技术学院.PPT

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
遗漏隐含概念课题垃圾处理方面-天津大学计算机科学与技术学院

目次 第1章 绪 论 第2章 信息检索基础 第3章 搜索引擎 第4章 事实和数值型信息检索 第5章 图书信息检索 第6章 期刊信息检索 第7章专利信息及商标信息检索 第8章 其他信息检索 第9章 检索案例选编 第10章 检索效率 第11章信息的分析利用 第10章 检索效率 10.1 概述 10.2 影响查全率的案例 10.3 影响查准率的案例 10.4 兼顾查全率和查准率的案例 10.1 概述 查全率=(检出相关文献量/文献库内相关文献总量)×100% 查准率=(检出相关文献量/检出文献总量)×100% 提高查全率的基本方法 1)扩大检索课题的目标,使用主要概念,排除次要概念。 2)跨库检索。例如使用国家科技图书文献中心的数据库或者Google实现对不同类型文献的一次性检索。 3)逐步扩大检索途径的检索范围。例如使用《中文科技期刊数据库》逐步提高查全率的字段依次是K=关键词/T=题名结合C=分类号→T=题名→K=关键词→R=文摘→U=任意字段。 4)取消限定条件。例如避免使用某些检索途径例如信息类型、语种、地理范围、年代范围。 5)降低检索词的专指度,可以从词表或检出文献中选一些上位词或相关词补充到检索式。 6)外文单词使用截词检索,可以采用前截断、后截断、前后截断等截词方法。 7)逐步扩大算符的检索范围,逐步提高查全率的算符依次是:位置算符w→nw→near→逻辑算符and→or。 提高查准率的方法 1)精确确定检索课题的目标,使用专业词汇。 2)选择专业性检索工具例如使用产品数据库、特种搜索引擎。 3)逐步缩小检索途径的检索范围,例如使用《中文科技期刊数据库》时,逐步提高查准率的字段依次是U=任意字段→R=文摘→K=关键词→T=题名→K=关键词/T=题名结合C=分类号;该数据库还能限定期刊范围:全部期刊→重要期刊→核心期刊。 4)用不太常用的检索途径例如信息类型、语种、地理范围、年代范围、作者或号码作为限定条件。 5)提高检索词的专指度,增加或换用下位词和专指度较强的自由词。 6)逐步缩小算符的检索范围,逐步提高查准率的算符依次是:逻辑算符or→and→位置算符near→nw→w;使用算符“not”排除干扰信息。 同时兼顾查全率和查准率的方法 1)跨库检索 2)分类途径和主题途径等多途径结合使用。 3)尝试多次检索 4)预防操作错误 10.2 影响查全率的案例 1.对课题的分析望文生义 2.检索工具收录范围有缺漏,功能较差 3.正确的常规检索方法也会有缺漏 4.用户选择不对口的检索工具 5.检索途径失误 6.选用了不规范的词 7.所选检索词与检索工具的用词习惯不符 8.遗漏隐含概念 9.遗漏了同义词 10.检索式有缺陷,限定条件过窄 11.误用禁用词 对课题的分析望文生义 实例:在Google检索我国生物技术在哪些地方比较发达?输入“生物技术 哪些地方 比较发达”为何检索不到信息? 对课题的分析望文生义 评析:难点是“发达”这个意思如何用关键词表达。在Google试用“我国生物技术发达地区”作为关键词进行检索,得知我们国家的生物技术还与国际发达国家有差距,不能检索到需要的信息。只要找出我国自己的生物技术研究机构的分布,就能达到检索目标。用检索式“我国生物技术 研究机构”搜索到“生物技术在线”,有《我国生物技术应用广泛》一文,文中提到:“我国生物技术产业通过20多年的发展已经初具规模,北京、上海、广州、深圳等地已建立了20多个生物技术园区。”故答案是在北京、上海、广州、深圳等地比较发达。 Google案例 Google案例 检索工具收录范围有缺漏 广西中医学院何报作教授在1994-2002年发表的中药研究论文有20篇被纸本型《中文科技资料目录—中草药》收录,而同期的数据库《中国学术期刊全文数据库》只收录了16篇。 正确的常规检索方法也会有缺漏 维普科技期刊数据库中经常出现的非规范术语等问题影响检索效率 用户选择不对口的检索工具 查找机械制造方面的资料选用电气电子类的文摘;用Google等网上搜索引擎找专利文献,利用期刊论文类的检索工具查询图书,没有结果。 提高查全的方法:用一个工具检索多个数据库 如:NSTL 国家科技图书文献中心NSTL 检索途径失误 案例:检索课题“教学实验室的管理”的信息 维普检索 人大复印资料检索 遗漏隐含概念 课题:“垃圾处理方面”的研究,如何增加检索词? 分析:垃圾处理隐含垃圾利用、垃圾再生等含义。 遗漏隐含概念 课题“垃圾处理方面”的研究,如何增加检索词? 遗漏了同义词 课题:“开创了我国造山带中系统研究古地磁的先例” 。 课题分析:检索式m=“造山带*古地磁”检索到2篇,为何检

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档