- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[其它课程]第二节高中信息技术
第二节 2.2.2 使用搜索引擎 搜索引擎是指根据一定的策略、运用特定 的计算机程序搜集互联网上的信息,在对 搜集到的信息进行组织和处理后,并将处理 后的信息显示给用户,是一种为用户提供检 索服务的系统。 常用的搜索引擎 搜索引擎的工作原理 1.抓取网页 2.处理网页 3.提供检索服务 搜索引擎的发展历史 现代意义上的搜索引擎的祖先,是1990年由蒙特利尔大学学生Alan Emtage发明的Archie。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,而且由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage想到了开发一个可以以文件名查找文件的系统,于是便有了Archie。 Archie工作原理与现在的搜索引擎已经很接近,它依靠脚本程序自动搜索网上的文件,然后对有关信息进行索引,供使用者以一定的表达式查询。由于Archie深受用户欢迎,受其启发,美国内华达System Computing Services大学于1993年开发了另一个与之非常相似的搜索工具,不过此时的搜索工具除了索引文件外,已能检索网页。 搜索引擎的组成 搜索引擎一般由搜索器、索引器、检索器和用户接口四个部分组成: 1、搜索器:其功能是在互联网中漫游,发现和搜集信息。 2、索引器:其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。 3、检索器:其功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息。 4、用户接口:其作用是接纳用户查询、显示查询结果、提供个性化查询项。 搜索引擎的分类 1.目录类搜索引擎 按目录检索。目录类搜索引擎不断收集网上信息,并进行整理,以分类目录的形式连接起来,供用户检索。用户通过逐级层层点击浏览这些类目,寻找自己所需的网站信息。例如:雅虎、搜狐、新浪等 例: 要了解目前世界濒危动物华南虎的数量,可访问新浪搜索引擎,在其分类目录中,搜索“动物→哺乳动物→华南虎” 目录类搜索引擎的特点 利用分类目录逐级查找,只能找到相关的网站,而不是这个网站上某个网页的内容。用户可以通过其目录结构了解其对信息的组织、存储情况 2.全文搜索引擎 按关键字词检索。全文搜索引擎将不断收集到的网上网页及网址信息以数据库的形式组织存储。查询时用户向其提问框中输入关键词,搜索引擎便会从数据库中检索与之匹配的相关记录,按一定的排序返回给用户。例如:Google、百度(Baidu) 例:要检索目前世界濒危动物华南虎的数量,可访问百度搜索引擎,输入关键词“华南虎”和“数量” 全文搜索引擎的特点 利用关键词查找,则可令搜索引擎自动搜索到与关键词匹配的网站和网页。这就是真正意义上的搜索引擎。其对信息的组织、存储是通过数据库来进行的 3.元搜索引擎 元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。 4.其他搜索引擎的方式 1)集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。 2)门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。 3)免费链接列表(Free For All Links,简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。 搜索时常见的错误 1.错别字 经常发生的一种错误是,你输入的关键词含有错别字,例如搜索某个名人或明星的资料时,把他们的姓名输错了,结果找到的信息可能就不是自己想要的。 2.关键词太常见 搜索引擎对常用词存在缺陷,这时可以通过输入多个关键词来找到自己所需要的信息。 3.多义词 要小心使用多义词,比如搜索“Java”,你要找的信 息究竟是太平洋上的一个岛、一种著名的咖啡、还 是一种计算机语言?搜索引擎是不能理解辨别多义 词的。 4:不会输关键词,想要什么输什么 错把搜索引擎当成是听话的服务员了,其实搜索引擎是很机械的,当你用关键词搜索的时候,它只会把含有这个关键词的网页找出来,根本不
文档评论(0)