网站大量收购闲置独家精品文档,联系QQ:2885784924

SEO培训:1.搜索引擎工作原理.ppt

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
最有“钱”途的课程 —如何让互联网成为您企业的赚钱机器 最有“钱”途的课程 一、搜索引擎的认识 1、什么是搜索引擎 搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集 信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给 用户的系统。 2、搜索引擎分类 A、全文索引 全文索引引擎是名副其实的搜索引擎。 它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户 查询条件相匹配的记录,按一定的排列顺序返回结果。    根据搜索结果来源的不同分为两类:一类拥有自己的网页抓取、索引、检索系统(Index) ,有独立的“蜘蛛”(Spider)程序、或爬虫(Crawler)、或“机器人”(Robot)程序(这三 种称法意义相同),能自建网页数据库,搜索结果直接从自身的数据库中调用; 搜索引擎工作原理 另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索 引擎。 B、目录索引 目录索引虽有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网 站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词( Keywords)进行查询。最具代表性的Yahoo、新浪分类目录搜索。 C、元搜索引擎 元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜 索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文 元搜索引擎中具代表性的是搜星搜索引擎。 D、垂直搜索引擎 06年后兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索 领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等), 在其特定的搜索领域有更好的用户体验。 E、其他非主流搜索引擎形式: 搜索引擎工作原理 (1)、集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引 擎进行搜索,而是由用户从提供的若干搜索引擎中选择。    (2)、门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类 目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。    (3)、免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目,少部分 有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。 3、搜索引擎的工作原理 A、抓取网页 每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接 ,连续地抓取网页。被抓取的网页被称之为网页快照。 B、处理网页 搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要 的就是提取关键词,建立索引文件。其他还包括去除重复网页、分词(中文)、判断网页 类型、分析超链接、计算网页的重要度/丰富度等。 搜索引擎工作原理 C、提供检索服务 用户输入关键词进行检索, 搜索引擎从索引数据库中找到 匹配该关键词的网页;为了 用户便于判断,除了网页标题 和URL外,还会提供一段来自 网页的摘要以及其他信息。 搜索引擎工作原理 4、搜索引擎的组成 搜索引擎一般由搜索器、索引器、检索器和用户接口四个部分组成。 (1)、搜索器 其功能是在互联网中漫游,发现和搜集信息; (2)、索引器 其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档 库的索引表; (3)、检索器 其功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息; (4)、用户接口 其作用是接纳用户查询、显示查询结果、提供个性化查询项。 搜索引擎工作原理 二、搜索引擎的匹配搜索请求 搜索请求是指搜索者在搜索引擎上键入的用来搜索的词语。每键入的一个词是一个搜索 项。 1、分析搜索请求 (1)、发现词的变体和校正拼写 搜索引擎工作原理 (2)、查找词组、非词组和停止词 A、词组 搜索者使用双引号将几个词放在一起作为一个词来搜索。这些放在一起的词称为“词组”。 搜索引擎工作原理 (2)、查找词组、非词组和停止词 B、非词组 搜索者键入一些非自己想要的搜索的无关紧要的词,这样的搜索项称之为“非词组”。 其中“怎么”,“样”这样的词称之为“非词组” 搜索引擎工作原理 (2)、查找词组、非词组和停止词 C、停止词 这些词是最常用的并且是语法中不可或缺的。如,”这“ ”一“等 搜索引擎工作原理 (3)、检查词

文档评论(0)

***** + 关注
实名认证
内容提供者

我是自由职业者,从事文档的创作工作。

1亿VIP精品文档

相关文档