- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第9章 搜索引擎的应用与评价 9.1 搜索引擎的基本概念 9.1.1 搜索引擎定义 搜索引擎(Search Engine)是一种用于帮助互联网用户查询信息的搜索工具,它以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。 9.1.2 搜索引擎的历史 1994年春天,Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了最早的真正意义上的搜索引擎Lycos。接着,Yahoo也在当年成立。 今天搜索引擎的核心是网络导航服务,有时搜索引擎成了门户网站的代名词,它们不仅提供网站搜索服务,还提供新闻、在线图书馆、词典,以及其它网络资源,涉及面越来越广。 9.1 搜索引擎的基本概念 9.1.3 搜索引擎的分类 搜索引擎按其工作方式分为两类:网站分类目录搜索引擎和基于关键字检索的搜索引擎。 ⑴网站分类目录搜索引擎 网站分类目录搜索引擎通过人工建立一个结构化的分类目录体系,将搜索到的网站划分到各个类别及子类下,并将每个网址抽象为一段摘要性信息,作为对该网站的概括介绍。 它的优点是层次清楚,方便用户简单准确地查找某一方面的信息,设计上也更简单、容易实现;缺点是靠人工操作工作量太大,因而搜索的站点少,更新慢;如果用户对查询问题的类目划分与该分类体系不一致,则有可能找不到相应的类目,搜索只在网站摘要而不是全文中进行,不够全面。 9.1 搜索引擎的基本概念 9.1.3 搜索引擎的分类 ⑵基于关键字检索的搜索引擎 基于关键字检索的搜索引擎,可以根据用户用逻辑组合方式输入的各种关键字(Keyword),寻找用户所需资源的地址,然后根据一定的规则反馈给用户包含此关键字词信息的所有网页的内容摘要和指向这些网页的链接。 随着互联网信息的快速增长,搜索引擎利用其内部的Spider(蜘蛛)或者Robots(机器人)程序,自动搜索一定范围内所有网站每个网页的头部信息,并把每页用于描述网页性质所有词汇作为关键字与网页的url地址一同放入数据库供用户查询。 基于关键字检索的搜索引擎很多,下面列举一些具有代表性的网站及其搜索引擎。 9.2 搜索引擎的工作原理与评价标准 9.2.1 META标记 ⑴META标记的产生 最初网页的设计很复杂,需要几个人一起来做一页,为了让大家都能了解这一页的主题中心,人们开始使用META标签,作为自己对页面的注释说明,同时这些说明浏览者看不到。接着出现了搜索引擎,它们首先遇到的一个障碍就是如何“自动”判定一个页面的内容。人们想到了META标签,检索机器人(Robots)只须检索页面的META值而无须整个页面就能了解该页面的内容了。 人们知道了引擎的这种运作方式,于是在页面中加入很多META标签以提高排名,很快搜索引擎对检索方法做了改进,对META的依赖越来越少,它们增加了自己的算法:综合考虑META标签、标题(TITLE)、页面最初几段的内容、域名的链接广泛性等。 9.2 搜索引擎的工作原理与评价标准 9.2.1 META标记 ⑵Meta标记的用法 Meta 标记是放在HTML文件的开头部分,它的功能之一便是向搜索引擎介绍网页,其它功能请参看HTML语法。 在编写Meta标记时应注意以下一些事项: ①搜索引擎只会搜索Title及Keywords中的文字,所以应该保持每页具适当而不同的Title,Description和Keywords。 ②关键词以逗号隔开,最好不超过255个字符,重要的要放在前端。 ③Keywords中的关键词一般不能重复多于5次,否则搜索引擎会撤除登录。 ④关键词可适当使用一些2至3字的词组。 9.2 搜索引擎的工作原理与评价标准 9.2.2 工作原理 ⑴搜索引擎的组成 搜索引擎基本由三部分组成,第一部分是蜘蛛软件(Spider),即自动的收集程序,它的作用是负责收集网页的内容;第二部分是索引器(Indexer),其作用是将收集回来的内容进行分析,然后做一个索引;第三部分是搜索器(Searcher),即响应用户的检索请求。当用户输入关键字后,搜索器用这个关键字与建立的索引器匹配,匹配后做相关性排序,再将排序结果送给用户。 ⑵搜索引擎的工作过程 搜索引擎通过某种界面(例如动态网页)跟用户交互,接受用户查询特定信息的请求,然后对用户查询请求进行分析,比如将查询请求分解成若干关键字,在分析用户请求之后,在索引数据库中不断进行匹配,挑出符合条件的信息,同时按照匹配程度的高低对结果进行排序,最后将排序后的结果返回给用户。 9.2 搜索引擎的工作原理与评价标准 9.2
您可能关注的文档
最近下载
- UbuntuLinux操作系统第2版(微课版)钟小平课后习题答案.doc VIP
- 输电线路三跨的经验分享.ppt VIP
- 电动汽车分布式驱动系统动力学分析与优化设计.docx VIP
- 专题1.4数轴与动点经典题型(四大题型)(原卷版+解析).docx VIP
- 幼儿小蝌蚪找妈妈绘本ppt课件.pptx VIP
- 磷酸铁行业现状.docx VIP
- 马克思主义与社会科学方法论课后习题答案(2018版).pdf VIP
- 6.1 树立法治观念 统编版道德与法治八年级上.pptx VIP
- GB_T 43933-2024 金属矿土地复垦与生态修复技术规范.pdf VIP
- 车牌识别系统软件使用说明8.1软件基本设置.pdf VIP
原创力文档


文档评论(0)