《第二章 信息检索与利用》.ppt

  1. 1、本文档共94页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《第二章 信息检索教程》 北京交通大学出版社《信息检索教程》系列课件 第2章 信息检索基础知识 1 信息检索的基本概念 1.1 信息检索的涵义 从广义上讲,信息检索包括两个过程, 一是信息存储(information storage),即信息的标引、加工和存储过程: 二是信息检索(information retrieval),即信息用户的查找过程。 从狭义上讲,信息检索仅指后一部分。 信息检索的本质是一个匹配的过程 即用户的信息需求和信息存储的信息集合进行比较和选择的过程 信息存储和检索过程的基本原理 计算机信息检索是对信息进行收集、分类、标引、著录,并加以有序化组织,将信息储存到计算机存储信息系统中,编制出一个信息检索系统或信息检索工具以及从检索系统或工具中检索所需信息的过程。 计算机信息检索的基本原理 1.3 信息检索的类型 按信息检索的内容划分 文献检索 数据检索 事实检索 概念检索 信息需求的类型 一、准确的信息 1、查找某概念的确切含义: 如:“什么是ADSL?” 如:“什么是会计信息系统?” 2、查找某概念的背景知识: 如“谁最先定义了信息素养?” 如 “奠定现代电子计算机理论基础的代表人物是谁?” 3、查找某些事物的数值及量化指标: 如“2005年国际无线传输的相关标准” 如“2008年中国互联网统计报告” 二、全面的信息 1、查找学科专业领域的新进展: 如“ERP的研究进展” 2、查找课题专业领域的相关研究文献: 如 “有关会计信息系统发展变迁的研究文献” 如“会计电算化环境下的审计工作研究” 信息需求来源于课题需求,课题需求决定信息需求类型: 了解某一理论、方法、过程等具体的片断的信息,以解决研究中的具体问题,要求以“准”为主。 申请发明、申报成果奖励、鉴定科研成果以及立项查新时,往往需要全面地收集某一主题范围的文献信息,这类课题具有普查追溯的特点,应着眼于“全”。 对于做学位论文来说,做课题前应充分了解一下本课题国内外的研究现状(即论文的综述部分),这时应对该课题进行较全面的检索,包括综述性的文章,要求全; 对于该课题的核心部分,即该课题所要解决的具体问题,创新的地方,则需要准; 对于技术细节越细越好,需要的也应是准。 案例 课目:“云南财经大学本科生科研训练计划(SRTP) ” 要求:云南财贸学院本科生科研训练计划(SRTP)管理规定。 拟研究的题目方向:会计电算化的理论或实务 案例(续) 信息需求1: 明确基本概念与定义、事实等 如:会计电算化的定义是什么? 案例(续) 信息需求2: 了解国内外在该领域研究应用的背景。 如: 会计电算化理论有哪些研究领域? 目前的会计电算化软件达到了什么水平?又存在什么问题? 案例(续) 信息需求3: 寻找研究的理论依据,掌握权威和重要信息。 如: 会计电算化理论研究有哪些成果? 关于会计电算化软件的成本、安全性、可靠性、可扩展性、适用性等。 案例(续) 信息检索:(过程略) 经检索分析发现,现有大量关于上述信息需求的各类文献资料,对一个在读的大二本科生,不论是理论研究还是软件开发,都受到水平、能力、精力、时间等的限制,且最终结果很可能是劳而无功,更谈不上创新。 案例(续) 进一步检索分析: 发现目前的会计电算化软件主要运行于Windows环境,少见基于Linux环境的会计电算化方面的文献资料报道。 最终拟定的题目: Linux在会计电算化中的应用前景分析 3 检索语言 检索语言(retrieval language)是文献信息标引和检索提问而约定的人工语言。 检索语言是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道。 ——在存储的过程中用于标引信息称为标引语言; ——用于编制索引就称为索引语言; ——用于信息检索则称为检索语言。 3.1 检索语言的种类 分类语言(classification language)是用分类号表达各种概念的检索标识,将各种概念按学科性质进行系统排列,反映科学知识分类体系的检索语言。 主题语言(subject language)是直接以表达文献主题的语词作为检索标识,按字母顺序编排并通过参照系统等方法提示词间关系的检索语言。 代码语言(code language)是对事物的某一方面特征用某种代码系统来加以标引和排列的检索语言。。 自然语言是直接从原始信息中抽取出来的未经规范化处理,用以揭示信息主题概念的检索语言。 分类语言 分类语言是按照一定体系由上至下,

文档评论(0)

enxyuio + 关注
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档