因特网凳子信息资源检索.pptVIP

  • 1
  • 0
  • 约2.06千字
  • 约 21页
  • 2019-01-02 发布于福建
  • 举报
因特网凳子信息资源检索

百度搜索“海南概括”: 元搜索引擎 特色信息检索工具 当我们查找图片、音频等信息时,使用综合信息检索引擎通常会找到很多无用的信息,所以搜索效率和有效性都不高。这时,就可以使用特色搜索引擎(有时是综合信息检索工具中的一个功能),特色检索工具专门搜集某一类的信息资源,内容丰富,数据量大,能帮助我们迅速找到一些有用的信息。 过渡页 过渡页 目录页 过渡页 过渡页 目录页 内容页1 目录页 过渡页 搜索引擎(Search Engine)是一种用于帮助因特网用户查询信息的搜索工具,它以一定的策略在因特网中搜集、发现信息,对信息进行理解、提取、组织的处理,并为用户提供检索服务,从而起到信息导航的目的。 信息检索 目录索引类搜索引擎 全文搜索引擎 按目录类别查找搜索: 比如:查高考资料 选择“教育”类目 没找到“高考”,就找 “教育”里跟接近“高考”的“中小学教育” 找到啦! 按关键词语查找搜索: 注意啦,要先在这里输入关键字! 现在可以按“搜索”按钮了 点击我就可以进入“高考”有关内容了! 工作原理 全文搜索引擎的工作原理 搜索引擎是如何搜索信息的呢? 你听说过“网络机器人”、“爬虫”、“蜘蛛”吗? 他们只是搜索引擎的一个部分,叫“搜索器” 搜索器 定期自动到各网站上抓取网页 搜索引擎的组成 索引器 分析抓取的网页,索引,存入服务器的数据库中 检索器 接收用户提交的关键词,从索引数据库中提取相关资源,显现结果 搜索器 索引器 输入查询表达式 查询结果显示 查询信息排序 采集结果 索引 数据库 检索器 索引 排序 用户查询 查询结果 信息采集 筛选 全文搜索引擎的工作原理: 百度蜘蛛 输入“海南概括” 查询结果显示 查询信息排序 检索器 索引器 索引 数据库 索引 排序 用户查询 查询结果 检索 中国日报网 爬 中国在线海南概括页面网址 抓 抽取“海南 、概括”等关键字 抽取 关联 工作原理 目录索引类搜索引擎的工作原理 (1)人工采集和存储网络信息,手工为每个网站确定一个标题,给出大概的描述,建立关键字索引,将其放入相应的类目体系中。 (2)网络目录: 按主题性质分类 以某种分类体系为依据 形成由信息链组成的树状结构 即总目录——专题目录——链接——网站 先分领域,后分各科专 题 ,最后列出网站 特点和区别 信息资源多、复杂,不易了解主题内容 网页内容丰富、学术性较强 搜索器定期自动“抓”网页 维护费用大、更新速度慢 搜索器在因特网中抓取网页,索引器提取、组织并建立数据库 人工采集并存储网络信息 需要关键字查询 无需输入关键字,可通过浏览主题了解某一主题的相关资源 全文索引 目录索引 元搜索引擎(1995年出现)是一种调用其他多个独立搜索引擎的引擎,是对多个独立搜索引擎的整合、调用、控制和优化,能方便地检索多个搜索引擎,扩大检索范围,提高检索的全面性。 元搜索引擎在搜索的时候,用户只需提交一次搜索请求,而且可以同时搜索多个数据库,并根据多个搜索引擎的检索结果进行二次加工,如对检索结果进行重排和标明检索结果来源等,输出给用户。 缺点:一般支持AND、OR、NOT等操作,一般只使用简单、直接的搜索策略,并且检索速度也慢。 此外还有一些专业性质的搜索引擎,如SOSIG是专门搜集社会科学信息的信息检索工具(http://www.sosig.ac.uk),涉及经济学、哲学、教育、政治、环境科学、心里学、人类学、社会福利、政府管理和妇女研究等信息资源。 以FTP、Telnet、Usenet等资源为检索 对象的检索工具。 如北大天网、Archic等。 其他信息检索工具 发展趋势 专业垂直搜索引擎 多媒体信息检索 传统的多媒体数据库中,除了文本和数字还包括图形、图象、声音、视频、动画等各种媒体组合。但多媒体信息具有丰富的内涵,如:图象的颜色、纹理、形状,动画中的运动、声音和音调等。例如歌曲的旋律、音调、音质等难以用文字描述。这正是基于内容的音频检索需要研究和解决的问题,以期达到更深的检索层次和更好的检索效果。 专业垂直类搜索引擎只面向某一个特定的领域,专注于自己的特长和核心技术,能够保证对该领域信息的完全收录和及时更新。 自定义页2 目录页 过渡页 过渡页 过渡页 过渡页 过渡页 过渡页 目录页 过渡页 内容页1 内容页2 自定义页2 结束页 自定义页2 自定义页2 目录页 过渡页 过渡页 过渡页 过渡页 过渡

文档评论(0)

1亿VIP精品文档

相关文档