- 1、本文档共142页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息的检索.ppt
信息服务部:惠斌 2.1 什么是信息检索? Information Retrieval Retrieval : The process of accessing information from memory or other storage devices. 什么是信息检索? 检索,就是查找和索取的意思。 信息检索 信息的存储(Information Storage) — 对有关信息进行选择,并对信息特征进行著 录、 标引和组织,建立信息数据库的过程; 信息的检索(Information Retrieval) — 根据信息检索提问制定检索策略,利用信息 数据库查找所需信息内容过程。 信息检索举例: 利用图书馆OPAC系统检索一本书? 2.2 信息检索的基本原理 抽象概括为:对信息集合与需求集合的匹配与选择 具体表述为:用户的需求特征与数据库中的每一条记录被标 引出的特征进行比较匹配 信息检索的本质是一个信息匹配的过程,即用 户的信息需求和特定信息集合的比较、选择的 过程。 所谓“匹配” ,就是将用户需求集合中的检索标识 提交到检索系统中,与检索系统中存储的信息特 征标识进行进行逐一比对,两者完全或基本一致 时,即为检索命中信息,从检索系统中输出。 2.3 信息特征 每件文献(一篇论文、一本书、一份报告等) 均有内容特征及其相关的外表特征。 从文献的特征出发,将其特征值与检索系统中 标引数据进行计算比较,通过匹配达到检索目 的。 ① 外表特征 题目、作者、出处、作者单位,专利和科技报告 还有专利号或者报告号等; 这些可以表征一篇特定文献的特征可以在文献的 封面或扉页,即不打开书本,或不看文献的具体 内容就可以确定一篇文献。 ② 内容特征 假如深入到文献内容中,则可以发现还可用以 下两种方法来表征它。 分类特征 一篇文献可以按照各种自然科学和社会科学的分类方法进行归类,如《中国图书馆分类法》(简称《中图法》) 可以把某一篇文献归入某一类,称之为该文献的分类特征。 《中图法》22个基本大类 社会科学 A 马克思主义、列宁主义、毛泽 东思想、邓小平理论 B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 自然科学 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、安全科学 Z 综合性图书 b. 主题特征 一篇文献都是论及某一方面的特定问题的,文 中与论题相关的词出现的频率较大,这些词称之 为文献的主题词或关键词。 主题词 关键词 关键词 关键词(keyword):是从文献的标题、文摘 和正文中直接抽取的,能够揭示和表达文献主 题内容并具有实质意义的未经规范化处理的 词。 又叫自由词。 除了禁用词(stop-term),如一些冠词、介 词、副词或连词外,凡在概念上有意义的词都 可用作关键词,它确保检索用词与文献记录中 的词汇完全一致。 主题词 主题词:又称叙词,在标引和检索中用以表达文 献主题的规范化的词或词组 所谓规范化,即词和概念一一对应,一个词表达 一个概念,通过“主题词表”进行规范化控制。 如:计算机应用、微机应用、电脑应用 都必须用“计算机应用”作主题词 信息特征的重要性 信息特征既是文献对象标志的基础,也是信息检 索的基础 用信息的各种内容特征和外表特征作为检索的出 发点,可以从不同角度来检索相关信息。 信息特征与文献的对应关系 文献的外表特征与文献是一一对应的,即一组外 表特征只对应一篇文献; 文献的内容特征与文献是模糊的对应关系,即一 篇文献有多个主题词或分类号,一个主题词或分 类号也可以对应多篇甚至几百篇文献。 2.4 信息检索的类型 按检索内容的不同,信息检索可分为: 文献检索(document retrieval) 数据检索(data tetrieval) 事实检索(fact tetriaval) 文献检索(Document Retrieval) 定义:是以文献为检索对象,从文献集合中查找出特 定文献的过程。 下列几例均属于文献检索。 1、如查找一本
文档评论(0)