第二章节信息检索基本知识点.pptVIP

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章节信息检索基本知识点

一 信息检索 二 信息检索语言、途径 三 信息检索技术 四 检索步骤;一、信息检索 信息检索:是指将信息 (主要指文献信息)按一定 的方式组织和存储起来,并 根据用户的需要找出相关信 息的过程。 ;检索的基本原理;信息检索一般过程;信息检索的过程往往需要一个评价反馈途径,多次比较匹配,以获得最终的检索结果。其图示如下:;二 信息检索语言、途径;1、检索语言的含义及作用;2、检索语言的类型;特征;;分类语言 也属于主题语言。分类语言是按学科范畴划分而构成的一种语言体系,它集中反映学科的系统性、反映它们的相关、从属、派生等关系,从总体到局部分层、分面展开,形成分类体系。由类目号码及名称作为检索语言,构成分类类目表,如前述图书分类表、专利分类表用的都是分类语言 。具体体现为用分类号和类名来表达信息的主题概念,如F25 物资经济 *中国图书馆图书分类法(5部类,22大类) *美国国会图书馆分类法 * 杜威十进位分类法 * IPC国际专利分类法 ;中图法大类表 ;《中图法》体系细分如下所示:;主题语言 包括:关键词语言、单元词语言、标题词语言、叙词语言等,它们有不同的主题词表。主题词表达概念本身,在主题词表中通过参照系统来指示词汇之间的关系。如”交通运输”、“国际物流”。主题语言分为规范主题语言与非规范主题语言。 规范主题语言:规范主题语言是以自然语言为基础,经过标准化、规范化处理的词语,具有概念性、规范性、组配性、语义性和动态性。规范主题语言包括单元词语言、标题词语言和叙词语言。 *单元词语言 是一种最基本的、不能再分的单位词语,亦称元词,它从文献内容中抽出,再经规范,能表达一个独立的概念。比如“天气雷达”不是单元词,只有“天气”和“雷达”才是单元词,在英语中,单元词经常是一个单词。如《WPI----规范化主题词表》 *标题词语言 是从文献的题目和内容中抽出来,经过规范化处理的主题语言。美国工程信息公司出版的《工程标题词表》(简称SHE)是典型的标题词语言,但该公司1993年以后改用《工程索引叙词表》(Ei Thesaurns)。;* 叙词语言 是以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主语语言。如《汉语主题词表》、《INSPEC叙词表》(《科学文摘》)、《工程索引叙词表》等。 非规范主题语言:它是相对于规范主题语言而言的,以自然语言的语词作检索标识,其所用词汇未经过规范化处理。非规范主题语言包括关键词语言和纯自然语言。 ※ 关键词语言 直接从文献信息的标题、摘要或内容本身抽取出来的用于揭示信息主题内容的自由词。 ※ 纯自然语言 指完全使用自然语言,即对一条完整的信息中任何词汇都可以进行检索。它采用全文匹配法检索,主要运用于计算机全文数据库和网络信息检索中。使用纯自然语言中检索中最大的问题是误检率极高。;★关键词的提炼;3、检索途径;信息检索途径及其选择;2、删除 将课题转换成关键词的集合 A.删除不具有检索意义的虚词(a,the,is等)和关键词(因使用太宽泛而不具有检索意义,如:http,com等) B.删除过分宽泛和过份具体的限定词 无损检测技术在材料性能评价中的应用?无损检测*材料 C.删除具有包含关系的其中一个 教学用的信息检索课多媒体课件?信息检索*多媒体*课件 3、替换 用更本质的概念替换表达欠佳的概念 稀土材料的研制?钐钴(用户实际上是研究钐钴材料) 空气中细菌的计算方法?空气污染的计算方法 水果营养(水果[fruit]=梨[pear]+橙[orange]+苹果[apple]+……);4、补充 A、补充还原词组:WTO?世贸组织?世界贸易组织 B、补充同义词或相关词: 计算机病毒?(计算机+电脑)*病毒 C、增加限定词(解决一词多义现象): 杜鹃?杜鹃(动物)、杜鹃(植物) 【获得主题词的技巧】:在图书的版权页可以找到该书的主题词和分类号,或者通过图书馆的馆藏数据来查找主题词。;分类途径 指根据文献所属的类别,利用特定的分类号来检索文献的途径。 优点:能够从学科或专业角度广泛地获得较系统的文献,能够达到较高的查全率。当所需要的信息范围比较宽泛或涉及内容复杂,仅用几个词语已无法涵盖检索需求时多采用分类途径。 例:检索“ 集装箱种类”的信息,该用何种途径? 分析: A、如果明确知道“集装箱种类”有哪些,而且知道具体名称,就用主题途径;(如保温集装箱、冷藏集装箱、柔性集装箱、液体集装箱、气体集装箱、干散物品集装箱、罐式物品集装箱、集装袋等 ) B、如果课题所指内

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档