第1章 信息检基础.pptVIP

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第1章 信息检基础

《现代信息检索》 主讲:华丹多吉 第1章 信息检索基础 1.1 有关信息检索的一些概念 1.2信息检索的类型及特点 1.3信息检索的基本步骤 1.4检索工具 1.5 检索语言 1.6 信息检索的发展趋势 1.1.1信息、文献、知识 1.信息的定义、特征和分类 信息的定义 信息是所有事物的存在方式和运动状态的反映,是频率变化的一种感 知,并且总是借助于一定的物质载体传输和存储(或者说信息是指消息接受者来说预先不知道的报道)。对于这个定义可以从两个方面理解:其一,客观世界中不同的事物是千差万别的,呈现出不同的状态和特征,从而在人们认识的过程中形成不同的信息。其二,人们感知外部世界,通常是通过声频或视频的变化而产生的,正如我们能听到雷鸣,鼓乐,能看到闪电,图像… 2.信息的特征 (1)传递性 (2)时效性 (3)共享性 (4)客观性 其他的特性还有开发性、存储性、价值的不定性、变换性、可伪性等。 信息的分类 (1)以存在环境为依据分为: 自然信息 生物信息 机器信息(自动控制系统) (人类)社会信息。 (2)以认识主体为依据分为: 客观信息,是指对事物不加判断的如实和公正的报道,即关于认识对象的信息。 主观信息,一般是依据事实和分析,阐明个人对论题的观点和见解,是经过思维主体加工的信息。 (3)以信息的逻辑意义和利害关系划分: 有益信息:对社会发展有积极作用的、能够消除人们对未知事物不确定性的信息,它是人类社会的资源和财富。 无用信息:指对信息使用者所从事的某种活动没有作用的、多余的信息。 有害信息:指对社会发展和信息用户有消极和阻碍作用的不真实或庸俗、媚俗的信息,主要有虚假信息和色情信息等。 (4)按信息表现形式划分为: 文字信息 图像信息 数值数据信息 语音信息 (5)按信息的媒体形式分为: 文本信息,按线性顺序排列的,阅读时,人们跟随文本的线性流向吸收其中的知识单元。 超文本信息,按知识单元及其关系建立的知识结构网络。其数据库由结点和链路组成,查阅超文本信息时,以知识片段及其关系作为追踪、检索的依据。 多媒体信息,多媒体是包括文本、图像和声音在内的各种信息表达或传播形式的总称。多媒体信息系统能针对用户的需求提供各种形式的信息。 超媒体信息,是指通过计算机控制,把各种文献载体和各种内容综合为一个整体,从而向读者提供各种形式和各种内容的资料。超媒体是超文本与多媒体两种技术的结合,即在信息浏览环境下超文本的信息管理方式与多媒体的信息表现方法结合在一起时,就称为超媒体。 2.知识的定义和分类 知识的定义 知识,是人类对于客观世界的认识。在这里,知识作广义的理解,包括消息、情况、事实、数据。知识可分为理性知识和感性知识。理性知识,是对客观事物的本质和规律性的认识,是经过思维、逻辑加工的知识,构成知识体系;感性知识,是对客观事物的描述和对现象、事实的感知,是未经逻辑加工的知识。 知识的分类 知识按不同标准可作如下分类: (1)依照反映对象的深刻性和系统性程度,知识分为生活常识和科学知识; (2)按知识的成熟程度,分为经验知识、理论知识。 (3)按领域:哲学知识、社会科学知识和自然科学知识; (4)按用途:科学知识、技术知识、文化知识; (5)按水平:低级知识、中级知识和高级知识; (6)按性质,普通知识、专业知识; (7)按载体:隐性知识、显性知识。 3.文献的定义和分类: 文献的定义 文献是记录有知识和信息的一切载体,是固化在载体(纸张、光盘)上的知识。文献是物化的精神产品,或者说,文献是知识信息的物化形态。其中,信息内容是文献的知识内核,载体材料是文献的存在形式和外壳,而符号系统和记录方式则是二者联系的桥梁和纽带。这4个要素相互联系就构成了文献的四维框架结构。 文献的分类 根据其内容性质和加工程度的不同,文献可分为以下四个级别: (1)零次文献:未经出版发行的文献,包括手稿、个人通信、原始记录等。 (2)一次文献:首次出版的各种文献,也称原始文献。如期刊论文、科技报告、会议论文、专利说明书等。一次文献是以科研生产活动的第一手成果为依据而创作的文献,内容丰富,参考价值大,是我们利用的主要对象。 (3)二次文献:报道和查找一次文献的检索书刊,如各种目录、题录和文摘等。二次文献是图书情报工作者在大量收集原始文献的基础上,经过分析、归纳、重组后出版的。二次文献是一次文献的集约化、有序化的再次出版,是贮藏、利用一次文献的主要的、科学的途径。 (4)三次文献:利用二次文献提供的线索,选用大量一次文献的内容,经综合、分析和评述再度出版的文献,如各种述评、进展报告、动态综述、手册、年鉴和百科全书等。我们使用的各种教科书也属三次文献。 文献按存储载体可分为: (1)印刷型:通过铅印、油印和胶印等手段,将知识固化在纸张上的一

文档评论(0)

l215322 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档