搜索引擎的工作原理教程解析.pptx

搜索引擎的工作原理 1.什么是搜索引擎? 搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等 一个搜索引擎由搜索器 、索引器 、检索器 和用户接口四个部分组成。搜索器的功能是在互联网中漫游,发现和搜集信息。索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档 以及生成文档库的索引表。检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。 ——维基百科 2.搜索引擎的基本分类 全文索引 目录索引 元索引 3.搜索引擎的基本组成 4.搜索引擎的工作原理 基本原理 1、找到网站的URL并下载页面。 2、判断页面质量是否达到收录标准收录页面,否则删除。 3、判断收录页面是否更新,更新页面快照。 1.通过网络爬虫获取信息 网络爬虫是搜索引擎的下载系统,它的作用是内容的获取,

文档评论(0)

1亿VIP精品文档

相关文档