Internet信息的检索改分析.pptVIP

  • 4
  • 0
  • 约1.26万字
  • 约 95页
  • 2016-06-10 发布于湖北
  • 举报
山东建筑大学图书馆 Internet信息检索 1.网络搜索概述 1.1网络信息资源状况 1.2 Internet搜索工具 2. 搜索引擎 2.1 搜索引擎的构成 搜索引擎技术集中体现在4个方面: 访问、阅读、整理Web信息的信息采集; 建立包含关键信息的索引数据库; 根据用户请求查找索引数据库相关文档的搜索软件; 为用户提供可视化的查询输入和结果输出界面的用户接口。 实现网络信息检索的搜索引擎技术可以分为2类: 网站分类目录技术 由专家对网站进行主题归纳和树状分类。这种 分类导航网站的资料库,搜集保存的是各网站的站 名、网址及内容提要。分类目录搜索引擎以超文本 链接方式将不同学科、专业或区域的信息按照分类 或主题目录方式进行组织,提供可供检索和查询的 等级式主题目录。 全文索引检索技术 能够对大量文档建立由字(词)到文档(网页)的倒排索引, 通过关键词匹配把含该关键词的相关网页查出来,但是返回 的信息量太大,“忠实表达”和“表达差异”问题难以解决。基 于全文的索引式搜索引擎,不是靠人工发现和甄别信息,而 是利用“蜘蛛”全文数据采集技术,沿着HTML文档链接自动 漫游,搜集网页内容建立索引或进行主题分类。索引数据库 根据“蜘蛛”的漫游周期自动更新。显然,基于全文的搜索引 擎资料库,搜集保存的是Internet各网站网页的内容,用

文档评论(0)

1亿VIP精品文档

相关文档