网海寻珠第二节.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
? 2011 NanJing NSFZJNFX. All Rights Reserved. AGILE CHEN AGILE CHEN 2010年03月07日 第二节 网海寻珠 信息检索的工具 -- 搜索引擎 信息检索的工具 -- 搜索引擎 1990年以前,没有任何人能搜索互联网。随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,最早现代意义上的搜索引擎出现于1994年。斯坦福大学的两名博士生,David Filo和美籍华人杨致远共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。目前,互联网上的搜索引擎已达数百家,其检索的信息量也不可同日而语。比如最近风头正劲的Google,其数据库中存放的网页已达30亿之巨! 说:“给我一个支点,我能撬起地球”。套用这句话来形容现在在互联网界如日中天的搜索引擎,那就是“给我一个关键词,我能找遍整个世界”。 一、搜索引擎的分类和工作原理 全文搜索引擎 – 也叫索引型搜索引擎:全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google,国内著名的有百度(Baidu)。 工作原理:由大规模机器运运行的程序 --“网络机器人或网络蜘蛛”通过从互联网上提取的各个网站的信息(以网页文字为主)检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。 例题1:全文搜索引擎显示的搜索结果是() A、搜索引擎索引数据库中的数据 B、被查找的在互联网各网站上的具体内容C、本机资源管理器中的信息 D、我们所要查找的全部内容 一、搜索引擎的分类和工作原理 目录索引:目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎(见工作原理)。国外代表是:YAHOO, Open Directory,国内最具代表性的是搜狐、新浪、网易。 工作原理:它把因特网中的资源服务器的地址收集起来,然后按目录分类,其实只是网站链接列表。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。 例题2:在搜狐搜索引擎中,先单击“科学技术”类别名,后选择“科学普及”类别,再单击“中国公众科技网”,这种搜索方式属于() A、全文搜索 B、元搜索 C、目录搜索 D、特色信息检索 /?c=more 一、搜索引擎的分类和工作原理 元搜索引擎(META Search Engine) :是一种调用其它独立搜索引擎的引擎, 把用户的搜索请求提交给多个独立的搜索引擎, 然后对返回的搜索结果进行去重、排序等工作,再把处理后的结果显示给用户。在这里,“元”(Meta)为“总的”、“超越”之意 。 国外: 国内: 一、搜索引擎的分类和工作原理 例题3:关于搜索引擎的分类,下列说法正确的是() A、搜狐属于全文引擎,Google属于目录索引类 B、搜狐属于目录索引类搜索引擎,Google属于元搜索引擎 C、搜狐属于目录索引类搜索引擎,Google属于全文搜索引擎 D、搜狐属于元搜索引擎,Google属于全文搜索引擎 例题 二、搜索引擎的发展趋势 1、多媒体搜索引擎 互联网上提供最多的,就是这种以“关键字”为搜索条件,将结果以文本的方式返回给用户。多媒体检索主要包括声音、图像的检索。如:中输入“南京”和在 中的区别。 二、搜索引擎的发展趋势 2、专业垂直搜索引擎 网上的信息浩如烟海,一个搜索引擎很难收集全所有主题的网络信息,很难将各主题都做得精确而又专业,使得检索结果垃圾太多。垂直主题的搜索引擎具有很高的针对性,比如象股票、房产、天气、新闻等类的搜索引擎。 其重要特征是:专业性 垂直搜索引擎站点的几条准则: 1、一个好的垂直搜索方向。 2、垂直搜索引擎的搜索结果要覆盖整个行业。 3、垂直搜索引擎定位于一个行业,服务于一群特定需求的人群。 例题4:某同学在的搜索栏输入“北京奥运会”,然后单击“搜索”,请问他的这种信息资源检索是属于( ) A、全文搜索 B、分类搜索 C、专业垂直搜索 D、目录检索 例题5:某同学在“的搜索栏输入高二物理试题“,然后单击”搜索“,请问他的这种信息资源检索是属于( ) A、专业垂直搜索 B、多媒体信息搜索 C、全文搜索 D、分类搜索 三、搜索策略 “工欲成其事,必先利其器”,对于搜索引擎的两个最基本的要求是信息的准确性和搜索的快速性。 1、逻辑命令:“+”表示包括、“-”表示排除、“*”表示通配符。还有“AND”、”OR”和“NOT”,例如:查成

文档评论(0)

fc86033 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档