- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章搜索引擎
第二章 搜索引擎 授课人:黄晴晴 时 间:2015.03.10 知识要点: 了解搜索引擎及其分类 掌握搜索引擎的工作流程、原理及作用 了解搜索引擎对网页的收录 了解熟悉知名搜索引擎 2.1 搜索引擎简介 概念: 搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。 搜索引擎分为两个主体,一个是用来统计数据的搜索引擎效劳器,另一个则是收录页面信息的搜索引擎机器人(也称蜘蛛)。 2.2 搜索引擎的分类 搜索引擎按其工作主要可分为三种: (1)全文索引引擎 (2)目录索引引擎 (3)元搜索引擎 2.21 全文索引 全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。 2.21 全文索引 按照搜索结果来源不同分为两类: (1)拥有自己的检索程序,自建数据库,搜索结果从自身数据库中调用,如百度、谷歌 (2)租用其他搜索引擎的数据库,按照自定的格式排列搜索结果,如Lycos搜索引擎主要利用FAST/AllTheWeb引擎搜索结果 2.21 全文索引 Lycos是搜索引擎中的元老,是最早提供信息搜索服务的网站之一,2000被西班牙网络集团Terra Lycos Network以125亿美元收归旗下。 Lycos整合了搜索数据库、在线服务和其他互联网工具,提供网站评论、图象及包括MP3在内的压缩音频文件下载链接等。 2.2 2 目录索引 目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。 目录索引中最具代表性的莫过于大名鼎鼎的Yahoo!、新浪分类目录搜索。 2.2 2 目录索引 中国雅虎搜索 2.2 3 元搜索引擎 元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。 著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。 在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。 2.2 3 元搜索引擎 Vivisimo搜索引擎 2.2 3 元搜索引擎 Dogpile搜索引擎 2.2 4 其他引擎 (1)集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。 (2)门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。 (3)免费链接列表(Free For All Links,简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。 2.3 知名的搜索引擎 2.3 知名的搜索引擎 2.3 知名的搜索引擎 2.3 知名的搜索引擎 2.3 知名的搜索引擎 2.3 知名的搜索引擎 一、网络营销的概念 讨论: 谈谈大家用搜引擎的感受! 2.4 搜索引擎的工作流程、原理及作用 (1)搜集信息形成快照 (2)整理信息分析页面 (3)接收查询处理关键词 2.4 搜索引擎的工作流程、原理及作用 网页快照中,搜索的关键词用亮色显示,用户可以点击呈现亮色的关键词直接找到关键词出现位置,便于快速找到所需信息,提高搜索效率。 当搜索的网页被删除或链接失效时,可以使用网页快照来查看这个网页原始的内容。 2.5 搜索引擎对页面的收录 2.51页面收录的流程 在互联网中,URL是每个页面的入口地址,”蜘蛛程序”通过这些URL列表抓取到页面的,“蜘蛛”不断的从这些页面中获取URL资源及存储页面,并加入URL列表,如此不断的循环,搜索引擎就可以从互联网中获取到足够的页面。
您可能关注的文档
最近下载
- 全国川教版信息技术八年级上册第三单元第3节《常见的策略》教学设计.docx VIP
- 城市轨道交通概论:城市轨道交通车站PPT教学课件.pptx VIP
- JB81-1994法兰(详细规格尺寸表).pdf VIP
- 读后续写(第一次独自骑自行车)讲义-2023届高三英语写作专项.docx
- 二氧化碳致裂器安全技术要求.pptx
- (高清版)DB4401∕T 109-2021 《历史保护建筑防火技术规程》.pdf VIP
- 【新版】苏教版五年级上册科学06.热对流 教学设计含反思.doc VIP
- 小学数学北师大版六年级上册《百分数的认识》教学设计.pdf VIP
- TZS 0678—2025《生物安全实验室工作人员本底血清样本管理规范》(水印版).pdf VIP
- YY_T 1892-2024 断裂点簇集区-艾贝尔逊白血病病毒(BCR-ABL)融合基因检测试剂盒.pdf VIP
文档评论(0)