- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
9 文献信息检索方法与技术
9.1 信息检索基础
9.2 信息检索途径、方法与步骤
9.3 计算机信息检索
9.4 检索效果评价
9.1 信息检索基础
(1)什么是信息检索
信息检索就是在信息的海洋里“大海捞针” 。如何捞?
利用过滤技术。
过滤技术的形式是多样的:
筛子:筛沙,筛米,筛面……
风:如扬场利用 自然风把稻谷与稻草末分开,风车用人造
风把米和米糠分开……
磁场:如用“质子回旋加速器”把质子和其他粒子分离
水:(利用浮力差别)
其他条件限制:身高、年龄、体重、学历、相貌、地域、
出身、单双号限制等等
9.1 信息检索基础
(1)什么是信息检索
案例:李开复从30万图片邮件中找出20封邮件(离开
微软到GOOGLE )。
方法:把图片转换为文字,再检索。
信息检索(Information Retrieval ):依据一定方法,
从已经组织好的有关大量信息集合中,查出特定的相关信
息的过程。
按照检索对象的不同,可分为文献检索、数值检索和
事实检索。
信息检索利用检索词、检索条件实现过滤。
9.1 信息检索基础
(2 )信息检索原理
信息检索包括存储和检索两个方面。
A .信息存储的过程
①信息采集:根据一定的规则收集信息。
②信息标引、著录。
对信息的内容特征和形式特征进行揭示和描述。
③编制检索工具或建立检索系统。
9.1 信息检索基础
(2 )信息检索原理
B .信息检索的过程
信息存储的逆过程。
用户根据信息需求,选取合适的检索词 (标题、著者
姓名、主题词、分类号等),利用检索工具或检索系统查
找出相关信息。
查找的过程实际上是一个匹配的过程,即确定检索词
并将检索词与标引词做相符性比较,二者一致,就算找到
了符合要求的信息。
9.1 信息检索基础
(3 )信息检索系统
广义地,信息检索系统是包含了从信息采集到信息检
索全过程的服务体系。
信息检索系统的四个基本要素: 目标;一定规模的信
息资源;实现存储与检索的技术装备手段;一定的存储与
检索方法。
狭义地,信息检索系统就是指用户查找信息所使用的
检索工具或系统。
随着技术的发展和应用,信息检索系统的物理形式发
生了重大变化,它曾经是一本书、一套卡片、一张光盘,
现在更多的是一个网络数据库。
9.1 信息检索基础
(4 )信息检索语言
A .信息检索语言的含义与作用
信息检索的实质,就是人们的信息提问与信息的检索
标识相比较后决定取舍的过程。一致,就“命中” 了信息。
不一致,就继续查找。
信息的标识用词和检索用词使用共同的语言来表达。
这种在信息的存储和检索过程中共同使用的语言,
就是信息检索语言。又称为情报检索语言、索引语言、标
引语言。
9.1 信息检索基础
(3 )信息检索语言
信息检索语言与自然语言的区别:
自然语言具有多义性。
信息检索语言是人工语言,具有唯一性。
信息检索语言对要对一词多义或多词一义的语词进行
规范化处理,例如:自行车、单车、脚踏车;鲁迅、周树
人。
各种文献分类法,如《中国图书馆分类法》、《国际
十进分类法》,以及各种主题词表,如《中国分类主题词
表》、《工程索引(Ei )叙词表》等,都是检索语言。
9.1 信息检索基础
B .信息检索语言的基础
概念逻辑和知识分类是信息检索语言的基础。
任何一种信息检索语言,都是表达一系列描述信息内
容的概念及其相关关系的概念标识系统。也就是说,它们
都是建立在概念逻辑基础上的。
主题分析就是将信息内容概括为某个或某几个概念。
信息检索
文档评论(0)