- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(word)信息检索技术
第一章 信息检索概述
1,什么是信息检索?它有哪些主要类型?
信息检索指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。有目的和组织化的信息存取活动,其中包括“存”和“取”两活动。
旧分类方法:文献检索、事实检索、数据检索
新分类方法:文本检索、数值检索、音/视频检索
2,试分析阐述信息检索的基本原理,信息集合、需求集合、匹配与选择,信息检索三阶段及期特点?
答:即信息集合与需求集合的匹配与选择。
(1)信息集合是指有关某一领域的,经采集、加工的信息的集合。形成可供用户访问与检索的对象,在某种意义上说,它是以一种公共知识结构,它有可能弥补某个特定用户的知识结构缺陷,即可以向用户提供所需要的知识或信息,或是获取知识的线索,或者提供某种信息区激活人脑中存储的知识。(2)需求集合:用户的信息需求是在社会实践活动中产生的。众多用户不同形态的信息需求的汇集,就形成了需求集合的存在。信息需求的产生与满足,是实施信息检索行为的前提与基础,也是实施信息检索行为的目的所在。(3)选择与匹配:面对信息集合与需求集合,如何在两者之间建立起联系与沟通的桥梁,以便能够从信息集合中快速获取用户所需要或所缺少的信息与知识呢?这就需要信息检索提供一种“匹配”机制。它的主要功能在于:能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。这里,我们要求匹配机制至少包括两个要素:一是匹配标准,即相似性标准;二是执行匹配的动因。
3,信息检索主要经历了哪些不同的发展阶段?各阶段有何特点?
(1)手工检索阶段,主要特点可以概括为印刷文献(图书、期刊、会议、专利、学位论文)为主要检索对象;以各类文摘、题录、和目录性工具书为可利用的主要检索工具;以图书馆的参考咨询部门为开展信息检索服务的中心机构。(2)计算机化检索阶段(脱机批处理检索时期、联机实时检索时期、联机网络化与多元化检索时间),主要特点:以各类机读数据库为检索对象;各类信息中心,联机服务中心作为新兴的信息服务部门而存在;信息检索用户逐渐由专业检索人员(检索中介)向个人终端用户转移和扩散。(3)网络化检索时期,分布式存储、分布式检索、分布式处理,检索范围领域广,传统技术与网络技术的结合,用户界面友好度,检索效率低。
4、名词解释
1)文本检索:指以各种自然语言符号系统所表示的信息作为主要检索对象的信息检索活动。
2)数值检索:针对数值型数据 的查询而发展起来的一类有特色的信息检索。
3)音视频检索:针对各种数字化音频与视频信息而进行查询的一类新兴的信息检索操作。
4)信息存储与检索:将信息按照一定的方式组织和存储起来,并能够根据信息用户的需求找出其中相关信息的过程。信息检索是一种有目的和组织化的信息存取活动,其中包括“存”和“取”两活动。
5)文献检索:以文献(包括文献、题目、或全文)为检索对象的一类信息查询活动,是一种相关性检索。
6)数据检索:以经过选择、整理、鉴定的各种数据信息的性能参数作为检索对象的一类检索,是一种确定性检索。
7)事实检索:针对从文献中提取出来的各种事实(或知识项)所进行的检索活动,是一种确定性检索。
第二章 信息源
1,如何鉴别高质量的期刊?
目前国内外公认的鉴别方式有2种:核心期刊和同行评审期刊。
(1)核心期刊:指的是刊载某一学科或专业有关的信息较多,且学术水平较高,能够反映该学科最新成果和前沿动态,受到该专业读者特别关注并成为检索与阅读首选的那些期刊。
(2)同行评审期刊:它是国内外高水平期刊对来搞评审普遍采用的方式。具体做法是:作者将文稿寄交编辑部并经初审合格后,为了审查论文的学术质量需要将论文稿送交有关专家(即同行)进行评审。
2,我国出版的专利文献有哪些?
目前我国出版的专利文献主要包括专利说明书、专利公报、专利索引等。既有一次文献,也有二次文献,他们是:
(1)发明专利公报、实用新型专利公报和外观设计专利公报(每周一次);
(2)发明专利申请公开说明书,发明专利申请审定说明书及实用新型专利申请说明书。
(3)专利年度索引;
3,书目数据库的特点是:信息密度高,文献报道范围广,数据量大,连续性和积累性强;数据结构简单,记录格式较为固定,费用低廉;检索途经多,速度快;更新周期较长。
4,全文数据库的特点:可直接利用;简化数据库标引和建库工作;避免了文献二次加工中的人为差错;后处理能力强。
5,名词解释:
1)电子信息源:指以数字化形式(即二进制码)将文字、图像、声音、动画等存储在光、磁等存储介质上,并能通过计算机、通信设备再现出来的信息资源。用于信息检索的机读数据库和网络信息源是目前2类最重要的电子信息源。
2)书目数据库:是一种专门存储二次文献信息的数据集合,亦称二次文献数据库,通常收录有关主题领域的各中
文档评论(0)