信息检索01266.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章 信息检索理论基础 主要知识点 (一)信息检索原理 (二)信息检索技术简介 (三)信息检索系统 (四)信息检索语言 (五)信息检索评价 (六)信息检索与数字图书馆 信息检索评价—检索系统评价   (1)信息源评价:数据库规模、收录范围、信息源质量控制等指标可反映信息源的质量。   (2)信息组织管理:主要指信息标引的方法、组织方式、及更新周期。   (3)系统功能评价:取决于系统所能提供的检索途径、检索方式、和检索方法。   (4)输出结果评价:主要包括信息检索系统对用户提问的响应时间、命中记录的排序功能和输出显示形式。   (5)用户接口:“用户友好”是信息检索系统用户接口的建设宗旨,它决定了用户是否喜欢使用该系统。   (6)系统技术支持:系统技术支持主要指系统及其软、硬件平台的通用性、兼容性、先进性、可靠性和稳定性。系统的性能价格比也是评价系统技术经济性能的指标。 信息检索评价--检索效果评价 (1)查全率:定义为:       检出的相关信息数 查全率 = —————————————×100%       信息库中相关信息总数 (2)查准率:定义为:       检出的相关信息数 查准率 = ———————————————×100%       检出的信息总数 (3)误检率:定义为:       检出的非相关信息数 误检率 = ————————————×100%       检出的信息总数 (4)漏检率:定义为:       未检出的相关信息数 误检率 = ———————————————×100%       信息库中相关信息总数 信息检索评价--检索效果评价   (5)其它评价指标   并不是每个用户都喜欢高查全率,不同的用户对查全率和查准率的要求都有不同。用户对查准率的容忍程度可能与他对查全率的要求有直接关系。由于查全率和查准率是基于与提问相关的文献数来计算的,而此相关文献数是由用户来判定的,不同的用户具有不同的判定标准。因此,提出了一种基于用户的评价方法,诸如覆盖度、新颖度、相关查全率和查全影响度等。检索效果评价的指标还有错检率,是测定检出的非相关信息数占库中非相关信息总数的比例;相关率,表明与提问相关的信息在系统中的分布密度等。   检索效益评价   对于检索效益的评价取决于社会效益和经济效益,评价并不是直接就可以显现的,因为它由一些不可比较的因素组成,有些方面需要通过间接的方法才能获得。另外,检索效益还具有潜在性和不确定性。因此在对检索效益评价时,需要考虑各个方面的问题。 第一章 信息检索理论基础 主要知识点 (一)信息检索原理 (二)信息检索技术简介 (三)信息检索系统 (四)信息检索语言 (五)信息检索评价 (六)信息检索与数字图书馆 信息检索与数字图书馆 数字图书馆是信息存储技术、信息检索技术、信息检索系统与现代网络技术结合的一个综合性应用的案例。数字图书馆定义有多种,其中之一认为“数字图书馆是全球信息高速公路上信息资源的基本组织形式,这一形式满足了分布式面向对象的信息查询需要”。数字图书馆并不是简单地将图书馆信息进行数字化存储,而是一个以统一的标准和规范为基础,以数字化的各种信息为底层,以分布式海量资源库群为支撑,以智能检索技术为手段,以宽带高速网络为传输通道的将丰富多彩的知识领域信息传递到千家万户的虚拟图书馆。 第一章 信息检索理论基础 重点和难点 重点和难点 (一)本章重点:信息检索模型及其特点;信息检索技术及其特点;信息检索系统及其组成;信息检索语言的作用、分类及应用。 (二)本章难点:信息检索模型、信息检索技术、信息检索语言的内含正确理解。 主要知识点 (一)信息检索原理 (二)信息检索技术简介 (三)信息检索系统 (四)信息检索语言 (五)信息检索评价 (六)信息检索与数字图书馆 信息检索原理--信息检索及其发展   (1)信息检索(Information Retrieval)是“一种时间性的通讯形式”,“在时间上从一个时刻通往一个较晚的时刻,而在空间上可能还在同一地点” 。这一看法,揭示了信息存储与获取两个环节是一种延时行的通讯形式。   (2)信息检索的基本原理,是对信息集合与需求集合的匹配和选择。信息集合是有关某一领域的文献或数据的集合体,它是一种公共知识结构,可能可以弥补该用户的知识结构缺陷。而匹配与选择则是一种机制,它负责把需求集合和信息集合进行比较,然后根据一定的标准选出符合需求的信息。   (3)在社会科学化的进程中,信息检索经历了从手工检索到机械检索再到计算机化检索的发展过程。   (1)信息检索的模型的含义:信息检索的模型就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻

文档评论(0)

xinshengwencai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5311233133000002

1亿VIP精品文档

相关文档