知识发现与信息检索-张小云 - 图书馆.PPT

  1. 1、本文档共132页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
知识发现与信息检索-张小云 - 图书馆

知识发现与信息检索 张小云 2004年9月1日 Tel:7885491 Email:zhangxy@ 课程目标 面对日益增长的Internet的信息和文献资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息,并综合成章。 ──这就是本课程所希望解决的问题。 分三部分: 1.知识发现 2.信息检索基本概念 3.信息检索 第一部分:知识发现 塞缪尔·约翰逊(Samuel Johnson)说:知识分成两类: 一类是我们要掌握的学科知识; 另一类是要知道在哪儿可以找到有关知识的信息。 Knowledge is of two kinds. We know a subject ourselves, or we know where we can find information upon it . 1知识发现 第二部分:信息检索基本概念 2.1 信息 定义——物质存在的一种方式,一般指数据、消息中所包含的意义。可以使消息中所描述的事件的不定性减少。 (*注:中国《情报与文献工作词汇基本术语》(GB48944-85)有关信息的定义。 信息的概念十分广泛,围绕信息而出现的信息资源、信息技术、信息系统、信息产业、信息化社会和社会信息化等相关术语不胜枚举。那么,什么是信息,至今仍无确切、统一的定义,站在不同的角度旧有不同的理解或解释。 1)按信息的加工程度划分 l? 零次信息资源——指尚未被记录下来,只是通过口头携带和传播的信息资源。零次信息资源的出现和传递带有极大的偶然性。其特点是鲜活、生命力旺盛。 l? 一次信息资源—— 指经加工或粗略加工的原始信息资源,如正在研究或创造过程中产生的信息,包括会议记录、论文报告、统计报表、专利等。其特点是比较零散,系统性不强,半包括所有的主要内容。 l? 二次信息资源——指在一次信息资源基础上加工整理而成的信息资源,如文摘、索引、目录等,它们是引导和使用一次信息资源必不可少的工具。 l? 三次信息资源——通过二次信息资源提供的线索,对某范围内的一次文献进行分析、研究加工而成的信息资源,亦称三次文献,包括综述、述评、专题情报研究报告、百科全书、年鉴、指南、手册、词典等。 信息交流渠道: 正式渠道:信息是指由正式组织发布并经由正式组织渠道向外传播,如官方新闻发布会、正式报告、国家统计部门发布统计信息等。 非正式渠道:非正式渠道信息指从正式渠道以外获取的信息。 2.2知识 是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的有组织的陈述。提供某种经过思考的判断和某种实验的结果。 知识的来源: 第一类是直接源于产生信息的客观事物; 第二类是通过信息载体或媒介(文献、电视、广播、他人等)的传递、交流而间接获得。 知识是有组织的大量的信息,获得知识有赖于获得信息; 信息是知识得以形成和传播的中介,而不是知识本身,知识是经过精心研究、领会后的有用信息,是人类对信息加工处理后的产物 。 第三部分:信息检索 ? 检索是信息组织的反变换过程。信息组织的目的是将零散的信息组成一个有序的体系,检索的目的则是迅速从这个体系中搜寻所需的信息。 对应于信息检索方法的操作主体,检索方法可分为: 手工检索; 机器检索。 信息检索特征: 1)有确定的目标; 2)有一个可能的信息解的集合; 3)有一定的线索(即启发信息); 4)搜索过程是针对一定的目标、遵循一定的线索,不断缩小搜索范围的求解过程。 从信息资源管理的角度讲,信息检索是从已存储的信息资源中检索出与用户提问相关的文献、知识、事实、数据的逻辑运算和技术操作过程的总和,以文献检索为本源。 ? 也就是说,这是一种从大量集合的文献中查找出主题及其属性符合用户要求的情报过程。查找的对象不一定就是文献,有时也可能是正在研究中的项目,或正在进行某项工作的人员与机构,或图书馆的藏书目录等,但基本原理是一致的。 信息检索能力(信息技能): ——寻求有关新知识的能力 具体表现为以下6种技能: 直检法:专业核心期刊跟踪 常规法: 顺查法, 倒查法, 抽查法 追溯法: 参考文献, 引用目录 综合法: 分段法, 循环法, 交替法 常用法 顺查法: 从远及近查,用于了解某一事物发展的全过程, 倒查法: 由近及远查,重点为近期 抽查法: 查找某一段时间的文献 检索效果 查全率 R (Recall ratio) R=检出的相关文献量/检索系统中相关文献总量*100% 查准率 P (Precision ratio) P=检出的相关文献量/检出的文献总量*100% (3)逻辑非“NOT” 逻辑非(A NOT B)检索出含有检索词A而不含有检索词B的信息资源。 如果A与B

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档