- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索复习题(综合最终)
1、信息存储与检索:广义地说是“信息存储与检索”(Information Storage and Retrieval),它是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。从本质上讲信息检索是一种有目的和组织化的信息存取活动,其中包括了“存”和“取”两个基本环节。对于“存”来说,主要指面向来自各种渠道的大量或海量信息而进行的高度组织化的存储;对于“取”来说,则要求面向随机出现的各种用户信息需求所进行的高度选择性的查找。
2、文本检索:指以各种自然语言符号系统所表示的信息作为主要检索对象的信息检索活动。
3、数值(据)检索:主要是针对数值型数据的查询而发展起来的一类较有特色的信息检索。
4、音\视频检索:主要针对各种数字化音频与视频信息而进行查询的一类新兴的信息检索操作。
5、电子信息源:指以数字化形式(即二进制码)将文字、图像、声音、动画等存储在光、磁等存储介质(如CD-ROM、磁盘)上,并能通过计算机、通信设备再现出来的信息资源。
6、书目数据库:一种专门存储二次文献信息的数据集合,亦称二次文献数据库,通常收录有关主题领域的各种书目信息,包括文摘、题录、目录等,以向用户提供文献信息,指引用户查找、使用原始文献。
7、文献索引数据库:主要是简要地通报有关领域某一时期发表的文献,供人们查阅与检索。它提供确切的文献来源信息,即能准确鉴别相对应的原始文献
8、全文数据库:一种源数据库,主要存储文献全文或其中的主要部分,可以将包括题名、著者、摘要、关键词、正文、参考文献和著作日期在内的数据全部收入数据库,供用户查询利用。
9、网络信息资源:指以电子数据的形式将文本、图像、声音、动画等多种形式的信息存放在光磁等非印刷型载体的介质中,并通过网络通信、计算机或终端等方式再现出来的电子信息源。
10、集中式系统:是资源有空间上集中配置的系统,单机检索系统是典型的集中式系统,它将软件、数据和主要外部设备集中在一套计算机系统之中。
11、分布式检索系统:是指通过计算机网络把分布在不同地点的计算机硬件、软件、数据库等设备和资源联系在一起,以服务于一个共同的系统目标而是实现的相互通信、相互操作和资源共享的系统。
12、用户界面:是用户与计算机之间的通信媒体或手段,是人机双向信息交换的软件和硬件。
13、搜索引擎:广义的搜索引擎泛指网络(尤其是万维网)上提供信息检索服务的工具或系统。狭义的搜索引擎主要指利用网络自动搜索软件或人工方式,对万维网信息资源进行采集分析与标引,并将索引信息组织成数据库,以网站形式为网络用户提供检索服务的一类信息服务系统。
14、收录范围:是指检索系统的数据库所覆盖的学科面、所收录的文献类型和数量,它现在已经演化成网站或搜索引擎的规模。
15、响应时间:是指从提问接收到检索结果提供所消耗的时间。
16、用户负担:是指用户在检索过程中花费的精力的总和。
17、输出形式:是检索系统提供的检索结果的形式,可能是书目信息,也可能是全文信息等。
18、相关性(评价核心):主要是指检索系统针对用户的信息需求从文档集合中检出的文档与用户需求之间的一种匹配关系。
问答题目:
1、什么是信息检索?它有哪些主要类型?
所谓“信息检索”,广义地说是“信息存储与检索”,它是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。从本质上讲信息检索是一种有目的和组织化的信息存取活动,其中包括了“存”和“取”两个基本环节。对于“存”来说,主要指面向来自各种渠道的大量或海量信息而进行的高度组织化的存储;对于“取”来说,则要求面向随机出现的各种用户信息需求所进行的高度选择性的查找。狭义理解是主要关注如何从存储的信息集合中快速获取各种需要的信息。
信息检索的主要类型
早期分类方法:文献检索、事实检索、数据检索三种类型
文献检索是指以文献(包括文摘、题录或全文)为检索对象的一类信息查询活动。
事实检索主要针对从文献中提取出来的各种事实(或知识项)所进行的检索活动。
数据检索主要以经过选择、整理、鉴定的各种数据信息,例如人口、国民生产总值、建筑材料的各种性能参数等作为检索对象的一类检索操作。
新分类方法:文本检索、数值检索以及音/视频检索
文本检索:是指以各种自然语言符号系统所表示的信息作为主要检索对象的信息检索活动。
数值检索:主要是针对数值型数据的查询而发展起来的一类较有特色的信息检索。
音/视频检索:是主要针对各种数字化音频与视频信息而进行查询的一类新兴的信息检索操作。
2、试分析阐述信息检索的基本原理。
信息检索的基本原理抽象概括为一句话,即对信息集合与需求集合的匹配与选择。
信息集合是指有关某一领域的,经采集、加工的信息集合体。信息集合是一种公共知识结构,有可能弥补某个特定用户的知识结构缺
文档评论(0)