- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4讲 搜索引擎工具软件 教学目的 了解搜索引擎的基本概念 掌握Google和Baidu的使用方法 熟悉Google Earth 熟悉Baidu Map 奇怪的域名 466453.com 内事绝不问百度 外事绝不问谷歌 4.1 搜索引擎 搜索引擎指自动从英特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。 英特网上的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为你绘制一幅一目了然的信息地图,供你随时查阅。 4.1搜索引擎 4.1.1搜索引擎分类 1.全文索引 2.目录索引 3.元搜索引擎 4.其他非主流搜索引擎形式: 4.1.1搜索引擎分类 1.全文索引 全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。 根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。 4.1.1搜索引擎分类 2.目录索引 目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo、新浪分类目录搜索。 4.1.1搜索引擎分类 3.元搜索引擎 元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。 4.1.1搜索引擎分类 4.其他非主流搜索引擎形式: 集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。 门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。 免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。 4.1.2搜索引擎工作原理 1.抓取网页 每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。被抓取的网页被称之为网页快照。 2.处理网页 搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。 3.提供检索服务 用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。 4.1.3搜索引擎搜索技巧 1.在类别中搜索 许多搜索引擎(如Yahoo)都显示类别,如计算机和Internet、商业和经济。如果单击其中一个类别,然后再使用搜索引擎,就可以选择搜索整个Internet还是搜索当前类别。显然,在一个特定类别下进行搜索所耗费的时间较少,而且能够避免大量无关的Web站点。 4.1.3搜索引擎搜索技巧 2.使用具体的关键字 如果想要搜索以鸟为主题的Web站点,可以在搜索引擎中输入关键字“鸟。但是,搜索引擎会因此返回大量无关信息,如谈论高尔夫的“小鸟球”或带“鸟”字的Web站点,如“悠悠鸟娱乐论坛”等。为了避免这种问题的出现,请使用更为具体的关键字,如“翠鸟””(鸟类学,动物学的一个分支)。提供的关键字越具体,搜索引擎返回无关Web站点的可能性就越小。 4.1.3搜索引擎搜索技巧 3.使用多个关键字 您还可以通过使用多个关键字来缩小搜索范围。例如,如果想要搜索有关浙江省台州市的信息,则输入两个关键字“台州”和“浙江”。如果只输入其中一个关键字,搜索引擎就会返回诸如台州足球队或浙江篮球队之类的无关信息。一般而言,提供的关键字越多,搜索引擎返回的结果越精确。 4.1.3搜索引擎搜索技巧 4.使用布尔运算符 许多搜索引擎都允许在搜索中使
原创力文档


文档评论(0)