- 1、本文档共115页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
课件信息检索原理
第二章 信息检索原理与方法 1. 信息检索概述 1.1 什么是信息检索? 信息检索(Information Retrieval): 是指将信息按一定的方式组织和存储(Storage)起来,并根据信息用户的需要找出(Retrieval)相关信息的过程。(广义)) 狭义的信息检索即信息查找(Information Search, Information Seeking ),是从信息集合中找出所需信息的过程。 1.2 什么是美术信息检索 从众多的、按特定方式组织与存储的美术信息资源系统中,检索出所需信息的过程。 信息检索过程主要包括两个方面(原理): 信息标引和存储过程:利用检索语言对信息资源进行标引,按一定的方式(分类、主题等)对资源进行集中。 信息的需求分析和检索过程:利用检索语言表达信息需求,进行检索,得出结果。 信息检索过程本质就是一个需求与信息集合中相关信息的匹配过程。检索语言是这种匹配的媒介。 1.3 信息检索的类型(根据检索目的和对象的不同) 1)书目信息检索 以标题、作者、摘要、来源出处、专利号、收藏处所等为检索的目的和对象,检索的结果是与课题相关的一系列书目信息线索,即检索结果不直接解答课题用户提出的技术问题本身,只提供与之相关的线索供参考,用户通过阅读后才决定取舍。因此,书目信息检索是一种相关性检索,得到的是信息线索。 2)事实型信息检索(Fact?Retrieval) 检索的结果是事实结论。查询某一事物(事件)的性质、定义、原理以及发生的事件过程等 或是有关某一事物的具体答案。 3)数据型信息检索(Data?Retrieval) 如某种材料的电阻,某变压器的参数,化学分子式、数据图表等 百科全书、手册、年鉴、名录等 如:2007年7月份美国消费信贷增幅是多少? 2011年3月8日人民币对欧元的汇率是多少? 针对美术信息检索的分析: 书目信息检索是从存储有标题项、作者项、出版项或文摘项的检索系统中获取有关的信息线索,如利用各种美术目录、题录和文摘检索系统。 数据检索是从存储有大量数据、图表的检索系统中获取数值性信息,如利用各种美术手册、年鉴、图谱、表谱等工具。 事实检索是从存储有大量知识信息、事实信息和数据信息的检索工具中获取某一事物的具体答案,如利用各种美术百科全书、年鉴和名录等检索系统。 按组织方式:全文检索、超文本检索、超媒体检索 按检索方式分:手工检索、计算机检索 1965年Ted Nelson在计算机上处理文本文件时想了一种把文本中遇到的相关文本组织在一起的方法,让计算机能够响应人的思维以及能够方便地获取所需要的信息。他为这种方法杜撰了一个词,称为超文本(hypertext)。实际上,这个词的真正含义是“链接”的意思,用来描述计算机中的文件的组织方法,后来人们把用这种方法组织的文本称“超文本”。 超媒体不仅可以包含文字而且还可以包含图形、图像,动画、声音和电视片断,这些媒体之间也是用超级链接组织的,而且它们之间的链接也是错综复杂的。 2.检索语言: 2.1 定义:是用来描述信息源特征和进行检索的人工语言,可以分为规范化语言和非规范化语言(自然语言)两类。 ??? 规范化检索语言是指对检索语言中的同义词、同音词、多义词、同形异义词、近义词等进行规范化处理的语言,它是受控语言,对检索语言概念加以控制和规范,每个检索词含义明确,以便淮确检索,防止误检、漏检。 为了使文献标引者和检索者用词统一,又能及时查到所需文献情报而编制出一些检索工具。 如美国医学索引的医学主题词表(MeSH),我国编制供标引中医药文献的中医药主题词表也属规范化检索工具,是对各学科名词概念进行规范化的记录,也是从事主题标引的依据。 非规范化检索语言:对检索词不进行规范化处理,用能反映文献实质性内容的词作检索词,如关键词。 2.2 作用:沟通信息存储和信息检索两个过程的桥梁。 在信息存储过程中,用来描述信息的内容和外部特征,从而形成检索标识; 在检索过程中,用来描述检索提问,从而形成提问标识; 当检索标识和提问标识完全匹配或部分匹配时,结果即为命中文献 2.3 检索语言的类型 2.3.1 分类语言 分类语言是以学科体系为基础,用号码作为概念标识,按分类编排的检索语言。国内外比较重要的分类语言表有《国际专利分类表》、《杜威十进分类法》、《中国图书馆图书分类法》、《中国科学院图书分类法》等。 《中图法》 《中图法》分为马列主义毛泽东思想、哲学、社会科学、自然科学、综合性图书五个基本部类。在五个基本部类的基础上,
文档评论(0)