第二章 搜索引的架构.pptVIP

  • 0
  • 0
  • 约 31页
  • 2017-06-16 发布于贵州
  • 举报
第二章 搜索引的架构

* 软件架构:在一个特殊的抽象层次用于描述系统的工具 搜索引擎的基本构件 组件及其功能 索引处理构件:文本采集、文本转换、索引创建 查询处理架构件:用户交互、排序、评价 总 结 * 第二章 搜索引擎的架构 * 搜索引擎 是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。 * 搜索引擎使用情况分析报告 * 搜索引擎使用情况分析报告 * 2.1 什么是软件架构 软件架构是在一个特殊的抽象层次用于描述系统的工具 通常包括软件组件、软件提供的接口以及各组件之间的联系 搜索引擎架构的需求 效果(effectiveness ):对于一个用户查询,希望检索到最多的相关文档; 效率(efficiency ):尽可能快地处理用户的查询 * 2.2 基本构件 索引处理 建立可查找的数据结构 查询处理 使用这些数据结构和用户的查询生成一个排好序的文档列表 * * * 2.3组件及其功能 索引处理构件 文本采集 文本转换 索引创建 查询处理构件 用户交互 排序 评价 * 爬虫 为搜索引擎发现和抓取文档; 许多类型,web, enterprise, desktop,主题爬虫 网络爬虫通过追踪网页上的超链接来找到并下载新的页面 - 能够高效处理互联网上大量出现的新

文档评论(0)

1亿VIP精品文档

相关文档