1.概论2.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三节 信息检索※ 一、信息检索的概念 广义:将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术。 狭义:从信息集合中找到所需信息的过程。 二、信息检索的类型※ 按检索对象划分   文献检索(Document Retrieval) 是信息检索的重要部分 数据检索(Data Retrieval)    事实检索(Fact Retrieval)    图像检索 多媒体检索 按检索方式划分 手工检索 计算机检索 (一) 信息检索语言 概念※ 实质上是一种检索标识系统,在信息检索中用来描述信息特征和表达检索提问的一种专门的人工语言。 作用:是沟通信息存储与信息检索两个过程的桥梁。 检索语言的种类※ 1.按其规范化程度不同: 非规范化检索语言——自然语言 规范化检索语言——人工语言 (关键词) 如: 艾滋病 爱滋病 AIDS 获得性免疫缺陷综合征 获得性免疫缺陷综合征 (主题词) 2. 按结构原理划分: ※ (1)分类检索语言 (2)主题检索语言 (3)代码检索语言 (1)分类检索语言 以分类号表达各种概念的一种检索语言。体现了学科的系统性。 相关概念: “分类号”/ “类目” / “子类” / “上位类” / “下位类” / “同位类” 国际十进分类法(UDC) UDC已有23种语言的版本。 UDC的类目表主要由主表与辅助符号、辅助表组成。UDC的主表把全部知识分为十大门类,每一类下分大纲、目、分目。UDC基本分类如 主题词(叙词)※ 叙词 ( discriptor )又称主题词( subject headings ),是能够表达文献主题内容的规范语言。 其主要特点是采用的词语有较严格的限定。对一个概念的同义词、近义词及拼法变异词等进行“规范”,以保证词语与概念的一一对应,是典型的规范化语言。 如:医学主题词表(叙词表)以后单独介绍。 关键词※ 关键词(keyword)是指出现在文献中的,能表达文献主题内容的,或被人们用作检索入口的关键性专业名词术语,不作规范化处理,没有特别的限定。 直接取自最新文献,即时反应科学领域的新观点、新方法、新发现以及新的名词术语。 容易造成漏检。 主题词和关键词的异同※ 主题词: 规范化检索语言 表达文献的主要内容 只用一个概念表达同一主题的文献,文献相对集中 各个主题词之间有参照系统和等级关系相互关联,从而文献之间也互相关联 一些新出现的名词术语不能在主题词表中及时出现。 关键词: 非规范化检索语言 表达文献的主要内容 新兴名词术语及时编制成索引 简单易于掌握 同一主题的文献分散,需要提供所有的同义词和近义词 不能显示出各个关键词之间的关联 (二)信息检索工具 目前的检索工具以数字化和网络化为主,后面单独详细介绍。 (三)信息检索途径 按文献外表特征划分 题名检索途径 著者检索途径 序号检索途径 按文献内容特征划分 分类途径 主题途径 关键词途径 …… (四)文献检索的方法 常用法(工具书法) 顺查法 / 倒查法 / 抽查法 追溯法 循环法 浏览法 (六)信息检索的效果评价 检索效果:指检索系统检索的有效程度,反映了检索系统的能力。 评价指标:收录范围、查全率、查准率、响应时间、用户负担和输出形式。 一、数据库 1、数据库定义: ※ 由计算机进行处理的一定数量同类信息的有序集合,是用来存贮和查找文献信息的电子化检索工具。 包含书目及文献有关数据的机读记录的有组织的集合。 数据库是存贮数据的仓库,也是文献检索的对象和主体。 2、数据库的结构: ※ 1.文件(File)(又称文档) 数据库中有关书目及文献信息的集合。由若干个相同类型及不同类型的记录组成。一个数据库可以只有一个文件,也可以包含若干个文件,每一个文件都有自己的文件名 。 2.记录(Records) 是文件的组成单元,一个记录代表着一条文献信息,由若干个字段组成,包括题录、文摘。 3.字段(Field) 记录中的各个项目。字段代表文献。一些基本特征,并且有检索功能。如篇目、作者、出处等。一个数据库中的字段通常有统一的格式,但每一个记录不一定包含所有的字段,如MEDLINE中每一字段通常由两个字母所组成的代码表示,TI AU SO PT。

文档评论(0)

fc86033 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档