- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.1 搜索引擎概述 2.1.1 搜索引擎的发展过程 搜索引擎的发展过程及其发展趋势。(★ ★领会)P.31 经历了4个阶段 2.1.2 搜索引擎的概念 搜索引擎的广义和狭义定义。 (★识记)从狭义的角度来说,搜索引擎是指对WWW站点资源和其他网络资源进行标引和检索的一类检索系统机制,由信息收集软件、索引数据库和查询接口三部分组成。从广义的角度上讲,搜索引擎是因特网的一类网站,是在Web中主动搜索信息(搜索网页上有意义的单词和简短的对特定内容的描述的词)并将其自动标引的Web网站以及标引的内容储存在可供检索的大型数据库中,并建立相应的索引和目录服务,从而对用户提出的各种检索做出响应,提供用户所需的信息或相关的指针。 2.1.3 搜索引擎的类型 搜索引擎的各种类型。 (★识记)1)按搜索机制划分,分为:关键词型、目录型和混合型。2)按搜索内容划分,分为:综合型、专业型和特殊型。3)按包含搜索工具的数量划分,分为:单独型和集成型。 目录式搜索引擎和关键词型搜索引擎在查准率和查全率方面的不同之处。 (★ ★领会) 关键词型搜索引擎查全率高,查准率低;目录搜索引擎查准率高,查全率低。 2.1.4 搜索引擎提供的服务 搜索引擎提供的服务。 (★ ★领会) 目前搜索引擎提供的主要检索服务有以下几类:目录检索;全文检索;精确检索;自然语言检索;多语种检索;媒体检索;过滤检索;智能检索;检索结果修正;检索结果排序;提供最新收录的新帖。 2.2搜索引擎工作原理与关键技术 2.2.1 搜索引擎的工作流程 搜索引擎的工作流程及其组成部分。(★识记) 2.2.2 信息搜集技术 信息搜集系统是通过网络机器人来自动完成的,不需要任何的人工处理。网络机器人:一个在网络上检索文件且自动跟踪该文件的超文本结构并循环检索被参照的所有文件的软件。 网络机器人的工作流程及其搜索策略。 (★识记)(1)机器人的工作流程:①机器人从起始URL列表中取出URL并从网上读取其指向的内容。②从每一个文档中提取某些信息,如关键字或整个网页,标引完这些检索点上的新文档后将其加入到索引数据库并组成倒排文档。 ③从文档中提取指向其他文档的URL,并加入到URL列表中。④重复上述3个步骤,直到再没有新的URL出现或超出了某些限制(时间或磁盘空间)⑤给索引数据库加上检索接口,向网上用户发布或提供给用户检索。(2)机器人的搜索策略:机器人的搜索策略用来解决当机器人程序搜索到一个文档后,下一步应该转移到哪一个文档的问题。①深度优先搜索策略。 ②广度优先搜索策略。③IP地址搜索策略。 ④深度和广度结合的搜索策略。 2.2.3 索引技术 索引技术的3种类型: (★识记)自动索引、手工索引和用户登录三类。 索引的4种类型: (★识记)(1)目录索引(2)文本索引或关键词索引(3)链索引(4)站点索引 2.2.4 检索器与结果处理技术 检索器提供的查询接口形式:目录导航式搜索引擎可提供两种查询接口形式:目录和关键词检索。网页搜索引擎一般只提供关键词检索。支持基本检索外,还支持高级检索。 检索结果的处理技术(★识记)可归纳为:①按频次排定次序②按页面被访问度排序③二次检索 2.3 搜索引擎的评价与使用技巧 2.3.1 搜索引擎的评价 搜索引擎的评价体系的各组成部分的内容(★识记) P.41-42 根据搜索引擎的性能评价体系标准来评价一个搜索引擎(如Yahoo,新浪,百度,Google) (★ ★ ★应用) 2.3.2 搜索引擎的使用技巧 搜索引擎的使用技巧 (★识记)(1)熟悉经常使用的查询工具及其特性是搜索成功的基础(2)确定使用哪一类搜索引擎,这是信息检索关键的一步 (3)关键字的选择是运用搜索引擎成功的重要因素(4)仔细研究该搜索引擎使用说明,能够极大地提高搜索效率,节省时间(5)使用操作符改善检索过程(6)打开多个窗口,进行多种尝试(7)要经常监控WWW站点上各个主要搜索引擎的排名情况 2.4 常用搜索引擎及其使用 Yahoo、新浪、百度、Google的搜索方式及其搜索常用运算符。 (★ ★ ★应用) 2.4.1 Yahoo!及其使用 搜索方式:普通搜索和高级搜索两种方式。 Yahoo!提供的操作符:① “”,查询完全符合双引号中的关键字符串的。如:“utility theory” ②+,限定该关键词一定要出现在结果中。如:computer+technology③-,表示逻辑非操作,限定“-”后面的关键字串一定不要出现在结果中。如:c
文档评论(0)