信息检索教程 冯惠玲 王立清 著 第一章 信息检索基础新.ppt

信息检索教程 冯惠玲 王立清 著 第一章 信息检索基础新.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章 信息检索基础 第一节 信息概述 一、信息的含义与特征 随着社会信息化进程的加快,信息已经渗透到社会生活各个领域,成为人类 社会不可缺少的重要资源。人们的一切行为决策,小到一个人外出是否需要带雨 伞,大到国家的宏观管理,都建立在相关信息获取分析的基础上。在当今时代, 信息的重要性日益凸现。 (一)信息的含义 信息(information)作为现今社会使用频率最高的词汇之一,显现着时尚, 蕴涵着古老。 (二)信息的特征 1.可存储性 2.可传递性 3.可转换性 4.可处理性 5.可共享性 6.可识别性 7.依附性 8.普遍性 二、信息的功能和类型 (一)信息的功能 1.传承人类文明,推进社会发展 2.提供决策依据,提高决策效益 3.保障有效控制,保证系统秩序 4.发挥参考作用,推动知识创新 (二)信息的类型 1.基于广义信息概念的信息分类 2.基于狭义信息概念的信息分类 三、网络环境下的信息变化 (一)因特网对信息的影响 1.因特网引发了信息新的出版形式———网络出版,形成了新型的网络信息资源 2.因特网使人类传统的信息交流方式发生了根本性的变化 3.因特网推动了信息处理技术的发展 (二)网络环境下信息的新特点 1.信息类型多样化 2.信息数量和内容都得到了极大的丰富 3.信息在分布上呈现出明显的分散性 4.信息共享程度提高 第二节 信息检索的概念和作用 一、信息检索的概念 信息检索(Information Retrieval)一词最早出现在20世纪中期。1950年, 美国数学家莫尔斯(Calvin W. Mooers)在一次国际数学会议上发表了论文《把 信息检索看作是时间性的通讯》,文中提出了信息检索。 (一)信息检索的概念 从广义的角度讲,信息检索包含信息存储和信息获取两个过程。 (二)信息检索的原理 信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出。 (三)信息检索的类型 1.文献检索(Document Retrieval) 2.数据检索(Data Retrieval) 3.事实检索(Fact Retrieval) (四)信息检索的发展 信息检索的发展经历了这样一些阶段: 1.手工检索 2.脱机批处理检索 3.联机检索阶段 4.光盘检索阶段 5.网络化联机检索阶段 二、信息检索的意义和作用 1.信息检索是有效利用信息资源、实现其最大价值的科学方法 2.信息检索是再学习的工具,是获取知识的有效途径 3.信息检索能有效地提高科研工作的效率,节省人力物力及时间 第三节 信息检索系统 一、信息检索系统的基本概念 信息检索系统是指根据特定的信息需求而建立起来的一种有关信息搜集、加工、存储和检索的程序化系统,其主要目的是为人们提供信息服务。 (一)信息检索系统的组成要素 1.信息 2.检索技术设备 3.检索语言及方法 (二)信息检索系统的工作原理 美国著名情报学家兰卡斯特(F.Wilfrid Lancaster)的图示向我们展示了信息检索系统的主要工作原理。信息检索系统包括信息的存储和获取两个部分,分别对应信息的输入和输出过程。 二、信息检索系统的构成 1.信息选择子系统 2.信息索引子系统 3.词表管理子系统 4.检索子系统 5.用户同系统之间交互子系统 6.匹配子系统 三、信息检索系统的分类 (一)手工检索系统 1.书本式的手工检索系统 2.卡片式的手工检索系统 (二)计算机检索系统 1.硬件 2.软件 3.数据库 第四节 信息检索效果 一、信息检索效果评价 信息检索效果是利用检索系统开展检索服务时产生的有效结果。它衡量了检索结果对用户需求的满足程度,是检索系统性能的直接反映。 (一)查全率(Recall Ratio)和查准率 (Precision Ratio) 查全率和查准率是由美国的佩里(J.W.Pery)和肯特(Allen Kent)于20世纪50年代中期提出来的,后经不断改进和完善,至今已成为评价检索效果最常用的两项关键指标。 (二)漏检率(Omissio

您可能关注的文档

文档评论(0)

带头大哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档