信息检索期末复习材料.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索期末复习材料

信息检索 第一章 信息检索基础 1、信息的含义: 广义的信息指自然界和一切人类活动所传达出来的信号和消息,是事物表现得一种普遍形式。 狭义的信息指经过搜集、记录、处理和存储的可供检索的文献、数据和事实 2、一次文献:指作者以本人的研究成果为基本素材而创作或撰写的文献。(著作、报纸、期刊、会议资料、研究报告、政府出版物、专利说明书、产品样本、标准文献、学位论文等) 二次文献:指对一次文献进行加工、提炼和压缩后所得到的报道性产物。检索工具书和网上引擎是典型的二次文献。(目录、题录、索引、文摘) 三次文献:是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的具体知识、数据。如综述、百科全书、辞典等。 3、信息检索的含义:从大量的信息集合中找出所需信息的过程与方法。 广义:包含信息储存和检索两部分 狭义:信息检索 4、信息检索的原理:将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配 5、信息检索的意义: ①信息检索是有效利用信息资源、实现其最大价值的科学方法 ②信息检索是再学习的工具、是获取知识的有效途径 ③信息检索能有效地提高科研工作的效率、节省人力物力及时间 6、信息检索的历程:手工检索、计算机检索 7、信息检索的方法:直接浏览法、常用法(顺查法、倒查法、抽查法)、追溯法、综合法 8、信息检索效果的评价指标:收录范围、查全率、查准率、响应时间、用户负担和输出形式 用户相关性判断 系统相关性测报 相关 不相关 总计 已检出 a b a+b 未检出 c d c+d 总计 a+c b+d a+b+c+d 查全率和查准率的关系、局限性 1)查全率=[检出的相关文献信息量/检索系统中相关文献信息总量]×100%=[a/(a+c)]×100% 2)查准率=[检出的相关文献信息量/检出文献信息总量]×100%=[a/(a+b)]×100% 3)查全率与查准率的局限性: ①对文献相关性的判断不可避免的带有主观性和模糊性 ②全部相关文献的总量很难确定 ③“相关文献”总是被同等对待,实际上其相关程度是有区别的 9、影响检索效果的因素: ①标引上网质量 ②检索语言的性能 ③检索途径的数量 ④检索策略的优劣 ⑤检索人员的素质 第二章 检索语言 1、检索语言的定义: 广义的检索语言泛指信息检索过程中涉及的人工语言和自然语言。 狭义的检索语言仅指根据信息检索的需要,按照一定的规则对自然语言进行规范,并专门用于信息标引 和用户检索的人工语言 2、检索语言的特点:①简单专指 ②一一对应 ③组合概念 ④便于排列 ⑤便于比较 3、检索语言的功能:①表达文献的特征 ②集中相同或相关文献 ③系统化和组织化 ④相符性比较 4、检索语言的分类: ①按描述文献的特征,可分为描述文献外表特征的检索语言和描述文献内容特征的检索语言 ②按结构或原理,可分为分类语言、主题语言、代码语言和引文语言 ③按信息的组合使用方法,可分为先组式语言、后组式语言河散组式语言 ④按语言的规范程度,可分为人工语言和自然语言 ⑤按构成原理分类,分类检索语言、主题检索语言、代码检索语言、引证关系追溯法 5、分类检索语言的特点:①是一部类目的汇编 ②是一个类目的体系 ③是一部类目的词典 ④是一部类目的排列表 6、分类检索语言的作用: ①进行分类标引和组织分类检索工具的典范 ②昨晚分类排架的依据 ③是检索者从分类途径文献资料的指南 ④是文献工作人员工作中的常用参考手册 7、体系分类法的局限性: ①难以克服的矛盾——集中于分散 ②列举法的列类方法 ③严格的逻辑体系给增加、删减类目造成困难 8、主题检索语言的含义: 又称主题法,采用词语直接作为文献主要标识,按字顺排列主题标识,提供各种检索词语的途径。 9、主题检索语言的类型:标题词语言、单元词语言、序词语言、关键词语言 10、主题检索语言的特点: 词语标识几乎是事物的名词,关于同一个事物的文献全部被集中标引在同一词语标识下,所以要在主题检索系统中查全同一事物的档案就比较容易 11、叙词法德原理: ①按主题集中文献 ②用规范化的、可以通过组配来表达复杂概念的词语直接标引文献主题 ③用参照系统、分类索引、等级索引、轮排索引和主题词关系图等多种方式来显示主题概念之间的相 互关系 ④用字顺序列直接提供主题检索途径 ⑤用

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档