认识搜索引擎.docVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验四 认识搜索引擎 一、实验目的 1、认识搜索引擎 2、了解搜索引擎原理及使用方法 3、在线查找搜索引擎 学时安排:2学时 二、实验内容 1、在IE浏览器输入网址: HYPERLINK /web/searchengine.htm /web/searchengine.htm,或是利用Google搜索引擎查询【认识搜索引擎】,找到该网页,了解搜索引擎的原理极其发展过程。 2、打开 HYPERLINK /index.htm /index.htm和 HYPERLINK / /,查看站点 HYPERLINK /index.htm \t _blank 中文搜索引擎指南网(搜网)和 HYPERLINK / \t _blank 搜索快报,了解搜索引擎有关新闻、使用技巧、排名规则、以及在商业上的应用。 3、在线查找搜索引擎,列出你所熟悉的中文引擎的前5名,英文引擎的前5名 4、列出至少20个搜索引擎(包括一个能够搜索—搜索引擎的引擎,报告中请注明) 5、使用不同的英文搜索引擎分别给出歌德巴赫猜想(Goldbachs conjecture)和世界名画《蒙娜丽莎》( HYPERLINK /play/243298.htm \t _blank Mona Lisa )的英文详细介绍网址,并分别给出内容的英文简介。 6、针对你的选题自选检索词利用英文搜索引擎检索,记录检索结果 三、实验报告 1、搜索引擎的原理 搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。   从互联网上抓取网页 利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。 建立索引数据库 由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。 在索引数据库中搜索排序 当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。 最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。 ?2、搜索引擎的使用技巧 对于搜索引擎的使用,简单的就是输入你的语言想法。通过提交获得,这中间就要求你懂得搜索引擎的一个搜索因素。就是搜索关键字或关键词。这个一般不会被大众用户所了解,普通用户只是简单的思考就形成一种搜索习惯。比较准确一点的话就是关键词组,例如:考试模拟题,上海到北京线路等等这些就是关键词组,再比较专业一点的就是关键字,这个主要是一些特殊定义的词,例如:北京旅游,上海酒店,成人高考,一心一意等等。 另一方面就是搜索引擎的专业使用,主要是搜索引擎命令搜索和搜索引擎的分类搜索。搜索引擎的命令搜索主要有查看网站收录情况,使用site:命令;查看网站的外链情况,使用domain:或者link:命令等。搜索文档等,使用filetype:文档格式(DOC,PDF,XLS,PPT等);还有使用函数符号搜索,使用加号(+)或者减号(-)号等来匹配内容;其次还有很多函数符号的使用,如:,intitle,inurl,tag,“”,(),related,url,image等等。另一方面就是类型搜索,如:百度文档搜索,百度音乐搜索,谷歌文档,字典搜索,地图,交通搜索等等。 搜索引擎的使用有很多比较巧妙的东西,很多都可以灵活运用,也可以综合使用。如:在指定的网站中搜索某一类的东西:site: 欢乐谷 ,这里是在驴妈妈网站搜索关于欢乐谷的东西;site: 欢乐谷攻略 ,这里是在驴妈妈网站搜索包含欢乐谷和攻略的信息。Inurl:bbs欢乐谷 这里是指在所有包含欢乐谷的信息,条件是同时要在url中出现bbs,这里还有一层意思是指,将bbs本身定义为论坛,这里总的意思也就是只在论坛中搜索包含欢乐谷的信息。 ?3、中文引擎前5名: 百度 HYPERLINK 谷歌 HYPERLINK /intl/zh-CN/ /intl/zh-CN/ Bing(必应) 搜搜 HYPERLINK / / 雅虎全能搜索 HYPERLINK / / 英文引擎前5名:

文档评论(0)

yurixiang1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档