能方便地检索多个搜索引擎.ppt

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三节 因特网信息资源检索 本节课主要内容 3.1搜索引擎的作用 3.2两种检索方式 3.4元搜索引擎 3.6元搜索引擎的特点 3.3Archie 3.7搜索引擎的发展趋势 三部分的作用 3.10目录索引类搜索引擎 选择题 判断题 小结 * * 主要学习各种搜索引擎及其发展趋势,并在此基础上进一步分析了搜索引擎的工作原理。 搜索引擎是一种用于帮助因特网用户查询信息的搜索工具,它以一定的策略在因特网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航目的。 1.目录索引类搜索引擎 2.全文搜索引擎 元搜索引擎是一种调用其他多个独立搜索引擎的引擎,是对多个独立搜索引擎的整合、调用、控制和优化,能方便地检索多个搜索引擎,扩大检索范围,提高检索的全面性。 元搜索引擎在搜索的时候,用户只需提交一次搜索请求,而且可以同时搜索多个数据库,并根据多个搜索引擎的检索结果进行二次加工,如对检索结果进行重排和标明检索结果来源等,输出给用户。 缺点:一般支持AND、OR、NOT等操作,一般只使用简单、直接的搜索策略,并且检索速度也慢。 Archie是第一个自动索引因特网上匿名FTP网站文件的程序,当时因特网还未出现,但网络中文件的传输频繁,由于大量文件散布在各个分散的FTP主机中,查询起来非常不便。 1990年McGill University的学生Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。 1、多媒体信息检索 传统的多媒体数据库中,除了文本和数字还包括图形、图象、声音、视频、动画等各种媒体组合。但多媒体信息具有丰富的内涵,如:图象的颜色、纹理、形状,动画中的运动、声音和音调等。例如歌曲的旋律、音调、音质等难以用文字描述。这正是基于内容的音频检索需要研究和解决的问题,以期达到更深的检索层次和更好的检索效果。 2、专业垂直搜索引擎 专业垂直类搜索引擎只面向某一个特定的领域,专注于自己的特长和核心技术,能够保证对该领域信息的完全收录和及时更新。 信息检索工具的工作原理 搜索引擎是如何搜索信息的呢? 你听说过“网络机器人”、“爬虫”、“蜘蛛”吗? 他们只是搜索引擎的一个部分,叫“搜索器” 1.搜索器:负责定期地自动到各个网站上,把网页抓下来,并顺着页面上的链接,持续不断地抓取网页。 2.索引器:把搜索器抓来的网页进行分析,按照关键词进行索引,并存入服务器的数据库中。 3.检索器:面向用户,接受用户提交的查询字串,在索引数据库中查询,并将查询结果反馈给用户。 全文搜索引擎的工作原理: 目录索引类搜索引擎一般采用人工方式采集和存储网络信息,依靠手工为每个网络确定一个标题,并给出大概的描述,建立关键字索引,将其放入相应的类目体系中。 目录索引类搜索引擎一般为一条链状组成树型结构: 总目录 专题目录 链接 网站 目录索引类搜索引擎最大的特点 就是在查询信息时,事先可以没有 特定的信息检索目标(关键词), 通过浏览主题了解某一主题的相关 资源。 目录索引类搜索引擎最大的缺点: 分类具有主观性,花费时间多,更 新速度慢。 1.目录索引类搜索引擎一般采用什么方式采集和存储信息( )。 A.人工方式 B.蜘蛛程序 C.关键字检索 D.检索工具 2.最早的FTP搜索引擎是基于文本显示的( )。 A.Google B.Baidu C.Archie D.天网搜索 3.下列不属于搜索引擎中“搜索器”工作程序的是( )。 A.网络机器人 B.蜘蛛 C.爬虫 D.CuteFTP 4.下列不属于元搜索引擎特点的是( )。 A.搜索时,用户必须多次提交搜索请求 B.可同时搜索多个数据库 C.一般支持AND、OR、NOT等操作 D.一般只使用简单、直接的搜索策略 1.常用的两种搜索引擎是目录类搜索引擎和元搜索引擎。( ) 2.为了适应不同搜索群体的需要,许多搜索引擎一般都提供多语种检索功能。( ) 3 .通过专业搜索引擎获得的信息资源一般来说比较权威。( ) 4.元搜索引擎的搜索范围可以是多个搜索引擎的数据库,而不局限于某一搜索引擎的数据库内。( ) *

文档评论(0)

sunhongz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档