信息检索与搜索引擎简介.ppt

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索与搜索引擎简介

信息检索技术 与搜索引擎简介 信息检索(Information Retrieval) 是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。 信息源—信息检索的基础。信息源的构成 : (1) 按文献载体分--印刷型、缩微型、机读型、声像型 (2)加工程度分--一次信息、二次信息、三次信息 (3)按出版形式分--图书、报刊、研究报告、会议信息、专利 信息、统计数据、政府出版物、档案、学位论文、标准信 息(它们被认为是十大信息源,其中后8种被称为特种文献) 信息检索是获取知识的捷径 信息检索是科学研究的向导 信息检索是终身教育的基础 美国在实施“阿波罗登月计划”中,对阿波罗飞船的燃料箱进行压力实验时,发现甲醇会引起钛应力腐蚀,为此付出了数百万美元来研究解决这一问题,事后查明,早在十多年前,就有人研究出来了,方法非常简单,只需在甲醇中加入2%的水即可,检索这篇文献的时间是10多分钟。 (1)手工检索 (2)光盘检索 (3)联机检索 (4)网络检索——搜索引擎 概括起来分为手工检索和机械检索 布尔逻辑检索: 利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种技术。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。 截词检索: 用截断的词的一个局部进行的检索,即利用检索词的词干加上截词符号去数据库中进行检索。凡是满足这个截词所有字符(串)的记录,系统都为命中。截词检索是计算机检索系统中应用非常普遍的一种技术。 位置检索 位置检索也叫全文检索、邻近检索。所谓全文检索,就是利用记录中的自然语言进行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。 字段限定检索 字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。在检索系统中,数据库设置的可供检索的字段通常有两种:表达文献主题内容特征的基本字段和表达文献外部特征的辅助字段。 加权检索 加权检索是某些检索系统中提供的一种定量检索技术。加权检索的侧重点不在于判定检索词或字符串是不是在数据库中存在、与别的检索词或字符串是什么关系,而是在于判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度。 聚类检索 聚类是把没有分类的事物,在不知道应分几类的情况下,根据事物彼此不同的内在属性,将属性相似的信息划分到同一类下面。 Internet搜索引擎 指自动从英特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。它只向用户提供源网页链接,不对原数据进行任何加工、处理。 企业搜索引擎 是指定位于企业领域、满足企业信息需求的搜索引擎。与传统Internet搜索相比,企业搜索只查询与企业相关的信息,所有的信息都经过部分人工和技术上的审核,保证了信息的真实性、准确性,安全性和商业价值。 * * 汇报人:计软件--Jenny 目 录 一、信息检索基础知识 二、信息检索的手段与技术 三、搜索引擎相关技术介绍 一、信息检索基础知识 1.信息检索相关概念 一、信息检索的基础知识 2.信息检索的意义 实际案例: 一、信息检索的基础知识 2.信息检索的意义 二、信息检索的手段与技术 1.信息检索的手段 二、信息检索的手段与技术 2.信息检索主要技术 二、信息检索的手段与技术 2.信息检索主要技术 二、信息检索的手段与技术 2.信息检索主要技术 三、搜索引擎相关知识介绍 1.搜索引擎—信息检索的手段 信息检索不等于搜索引擎,但搜索引擎仍然是信息检索的主要手段。 A.目录式的搜索引擎(Directory) 它提供一种可检索和查询的等级式主题目录,以超文本链接方式将不同学科、专业、行业和区域的信息按照分类或主题目录的方式组织起来。著名的雅虎(Yahoo)就是一个典型的目录式搜索引擎。 B.全文式搜索引擎 这类搜索引擎的数据库中保存着网站每一个网页的全部内容,用户在检索框中输入需要查询的关键词或短语,搜索引擎返回与输入关键词相关的一个个网页的地址和一段文字。著名的搜索引擎百度、GOOGLE等就是全文式搜索引擎。 2.搜索引擎的类型 三、搜索引擎相关知识介绍 C.综合式搜索引擎 此类搜索引擎既可以搜索网站也可搜索全文,用户输入关键词后,可以选择是搜索网站还是网页,不同的选择返回不同的结果。国内著名的新浪、搜狐(Sohu)就是此类搜索引擎。 D.元搜索引擎(Meta-search Engine)

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档