计算机信息检索基础.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机信息检索基础.ppt

文献信息检索 Information Retrieval 利用计算机对信息和数据的高速处理能力来实现信息的存储与检索。 一、 计算机信息检索原理 计算机信息检索:用户利用数据库获取所需信息的过程。 即:计算机将输入机检系统的用户提问标识(检索词)与已存贮在系统中数据库内的文献特征标识(标引词)进行匹配比较,凡符合给定的比较原则和逻辑运算条件者即为命中文献。 快速 准确地 获得结果 缺点:收费、有时间限制、回溯性差,无法查久远的或最新的文献。 二、检索软件类型 检索软件即用户与系统对话的界面, 可分为以下两种: 指令检索示例 菜单检索示例 三、数 据 库 1.数据库定义 相互关联的数据在计算机外存储器上有序的集合. 2、数据库结构 Framework of Database 字段名称及代码 基本字段: 字段名称 段码 文摘(Abstracts) AB 题目(Title Word) TI 主题词(Descriptor) DE 标识词(Identifier) ID 辅助字段: 作者 (Authors) AU 作者单位(Corporate Source) CS 刊名(Journal Name) JN 年代( Publication Year ) PY 3、数据库类型 types of databases 文献数据库 书目数据库(bibliographic database) 存储二次文献,其检索结果是文献的线索而非原文。 如BKSY 全文数据库(full text database) 存储一次文献 提供原始文献全文 数值数据库(numeric database) 主要存储用数值表达的量化信息 WHO 的世界卫生统计数据 事实数据库(fact database) 主要存储三次文献 what、where、when、who、why、how 类信息 《中国大百科全书》 Marriam Webster Dictionary 提供的《大不列颠百科全书》 免费查询 多媒体/超文本数据库 multimedia/hypertext database 同时存储声音、图像、文字等的超文本信息。 检索者如何让计算机实现自己的检索意图? 四、检索提问表达式 字词类 获得性免疫缺陷综合征 AIDS 刘伟 中国行政管理 云南大学 3一乙酰基一5一羟甲基 数码类 2007(年) C19H33NO2HCL(分子式) 343.94 分子量 D665.2(分类号) GNGY(基因代码) 54-16-089 化学物质登记号 (二)、运算符 questions 布尔逻辑运算符 Boolean Operators 逻辑与 示例 糖尿病与高血压 逻辑或 示例 政治、经济、宗教与伦理学的关系 逻辑非 示例 非共产主义人生观 B821.2(人生观、人生哲学中除共产主义人生观外的那一部份) 逻辑运算次序 布尔逻辑运算次序 布尔逻辑的运算就象数学中的四则运算的“先乘除后加减”一样,也有优先级的问题,它的优先级从高到低依次为: 非(NOT)→与(AND)→或(OR) 当然,括号最优先。因此,括号也称为优先符。优先符可以改变布尔逻辑的正常运算次序。 如:信息+情报 NOT 经济 (信息+情报)NOT 经济 检索结果不同。 示例 胃炎、胃溃疡、胃肿瘤与幽门螺杆菌 的相关性 (不要 cagA ,vagA) 布尔逻辑的运算可以进行同类项的合并。 如:A*B+A*C=A*(B+C) 然而,在使用布尔逻辑时,必须注意以下几条交换规则: A*B B*A A+B B+A A-B≠B-A 2. 截词检索 以符号取代检索词(中、尾)的部分字符,从而检出相同词干和相同词根的词。 截词包括后截、中截、前截等。用?作为截词符 有些系统用* ,主要包括下列情形: 截词符?  中截一字符,后截断n个字符   如 wom?n 可以检索出: woman, women 又如 computer?——以computer词干开头的词 可以检索出:computer、computers、computing、computerize、computerise 注意:截词是计算机信息检索的一项重要特性,不同数据库有不同的截词符,大多数为“?”。 示例 1 词中替代: 示例 2 词尾截断: 3、 限制检索 在信息检索系统中,为了满足某种检索条件或达到某种精确程度,通常使用一些缩小或限定检索结果的方法。针对特定年代、特定类 别、特定检索点等作限制,包括前缀限制符和后缀限制符。 网络信息检索中可对文献信息类型进行限制 如在谷歌和百度搜索引擎中 检索特定的文献类型: “报告 filetype:pdf ”

文档评论(0)

只做精品 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档