信息存储与检索基本原理技术介绍.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
自然语言在信息检索中应用的各种方式 关键词法 文本检索 单汉字检索 自动赋检索词或分类号 自动聚类法 自由标引 3 超文本 超文本技术将文本信息存储在无数结点(node)上,一个结点就是一个相对独立的“信息块”,结点之间用“链”(link)连接,组成信息网络。 它同样可以链接声音、图像(形)、影视等多媒体信息,构成超维检索点。 超维系统理论模型 Dexter——一种基于超维交换格式的标准的模型 HAM——适用于多重类型的超维系统模型 第四节 信息检索方法 一、检索方法的种类 二、选择检索方法的原则 一、检索方法的种类 1、常用的查找方法,直接利用检索工具检索。 顺查:课题起始年代为起点,由远而近,查全、查准率较高,但费时、费力 倒查:由近及远,查准率较高,查到前面一定时间不查了,所以漏查率较顺查高,但省事 抽查:针对学科发展最快,文献发表最多的年代查,省时,但必须熟悉学科发展特点 2、追溯查找法,利用文献末所附的参考文献进行追溯 3、循环法,直接法和追溯法的结合,交替使用。 4、原始法,分散性检索,利用原始文献直接浏览 二、选择检索方法的原则 1、要看检索条件 检索工具缺乏而原始文献收藏丰富宜用追溯法,有成套检索工具则宜用直接法,其查全率、查准率都比追溯法高。 2、要看检索要求 1)要求收集某一课题的系统资料,要求全面,不能有重大遗漏,最好用顺查法 2)要解决某一课题的关键性技术,不要求全面,只要能解决这个关键问题就行,要快,针对性强,要准,宜用倒查法,迅速查得最新资料 3 、要看检索学科的特点,古老学科,开始年代很早,只好用倒查法,新兴学科,起始年代不远,可用顺查法,波浪发展的学科,可选择发展高峰,用循环法 第五节 信息检索效率 一、衡量信息检索效率的指标 二、检索效率的基本特性 三、影响信息检索效率的基本因素 四、提高查全率的措施 五、提高查准率的措施 一、衡量信息检索效率的指标 被检出的文献: 有关文献 a 无关文献 b 未被检出的文献: 有关文献 c 无关文献 d 查全率R= = 查准率P = = 漏检率 O = = 误检率N = = 查全率和漏检率是互补的,查准率和误检率是互补的 二、检索效率的基本特性 查全率 ……. ? 查准率 ……. ? 从? 式得 R(a+c)=a Rc=a(1-R) 即: …….. ? 同样从? 可得: …… ? 从? 和?得: ……? 由? 可得: ……? ?式中b,c 为系数, ?为变量P,R的二元方程 如图所示: P高则R底;R高则P底 要取得较好的检索效果应兼顾二者,一般,查全率为:60~70% 查准率为:40~50% R P 0 三、影响信息检索效率的基本因素 1、检索系统的质量(数据库)和所用的检索语言 2、检索人员的知识和技能 文献检索知识 知识 外语知识 三方面的知识都要 科技专业知识 检索技能的高低表现在: 1)了解和熟悉有关专业领域的各类检索工具,具备选择检

文档评论(0)

贪玩蓝月 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档