第三讲第二节因特网上信息检索的方法.pptVIP

第三讲第二节因特网上信息检索的方法.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
知识回顾 因特网非常受欢迎的一个应用是万维网。借助于万维网    ,软件沿着下划线链接,你会很容易地从一个页面导航到其他页面。网页被保存在    中,并且每个页面都有一个惟一的地址,被称为 。 学习目标: 1、掌握搜索引擎的分类与特点。 2、了解搜索引擎的产生与发展。 3、理解搜索引擎的工作原理。 重点:搜索引擎的类型与特点。 难点:搜索引索的工作原理 在因特网中信息检索的方法:? 1、基于超文本/超媒体的信息浏览 通过一个网站中的链接去访问另外一个信息资源 2、基于目录服务的信息查询(目录式搜索) 3、使用搜索引擎进行信息检索(全文搜索)? 搜索引擎 1、?世界上最早的搜索引擎是超级目录索引 ,出现在? 年?设计者是:?? 2、?按信息搜集方法和服务提供方式,搜索引擎有:      在这几中检索工具中, 目录式搜索引擎虽有成本高,信息少的缺点,但它的信息准确这一优点是另二者所无法比拟的,故在一定的领域,一定的时间,它仍会被使用; 全文搜索引擎是当前各种搜索引擎的主流; 搜索引擎分类不同,工作方式也不同,因而导致了信息覆盖范围方面的差异,仅限于使用单一的搜索引擎是不明智的,根据不同的要求选用不同的搜索引擎或者两者结合使用才是明智之举。 小结 因特网信息检索方法: 1、基于超文本/超媒体的信息浏览 2、基于目录服务的信息查询 3、基于搜索引擎的信息检索 搜索引擎的分类、原理: 1、目录式搜索引擎:人工;量少质高,更新慢 2、全文搜索引擎:蜘蛛程序(机器人);量多,杂 3、元搜索引擎:实现简单,没有自己的数据库 其他:检索代理;特种搜索引擎 搜索引擎的分类 搜索引擎的分类 搜索引擎的分类 浏览器 服务器硬盘 统一资源定位器(URL) 3.2 因特网上信息检索的方法 3.2 因特网上信息检索的方法 1994 美籍华人杨致远和美国人David Filo ①目录式搜索引 (雅虎、搜狐) ②全文搜索引擎 (goole、百度) ③元搜索引擎 (比比猫Bbmao ) 雅虎(yahoo) 搜索引擎的工作原理 以人工方式或半自动方式搜集信息,由编辑人员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务;目录的用户界面基本上都是分级结构,首页提供了最基本的几个大类的入口,用户可以一级一级地向下访问,直至找到自己感兴趣的类别。 目录式搜索引擎 组织、分类、存储 人工或半自动方式 收集信息的URL 用户查询 获取相关信息的源位置(URL) 通过浏览器软件访问 搜索引擎网络公司 搜索引擎的工作原理 全文搜索引擎 搜索引擎网站的计算机服务器就是厂房,而“蜘蛛”、“机器人”、“爬虫”等自动网页搜索程序扮演了采购员角色,需要整日奔波在网络上以采购网页。采购回来的网页由加工工人“网页搜索引擎程序”进行加工,加工好的产品则存放到产品仓库“索引数据库”中,供用户查找。在用户使用搜索引擎进行资源检索时,与用户直接打交道的是用户接口程序(例如浏览器),用户接口扮演了“订单接收及送货员”的双重角色,它接收搜索关键词并将其传送到搜索引擎服务器上,同时还负责显示经过排序的检索结果,供用户有选择地打开找到的网页,然后将检索结果传送给用户接口程序。 搜索引擎的工作原理 一股是自动网页搜索程序在因特网上搜索网页,并将网页信息不断地传回服务器。索引编辑程序对传送回来的网页信息进行加工,建立索引,存储到索引数据库中。另一股是学生所熟悉的,即用户输入搜索关键词,用户接口程序将其传送到搜索引擎服务器上。服务器上的检索程序根据关键词在索引数据库中进行查找,并将查询结果传送给用户接口程序,用户接口程序再以网页的形式向用户显示查询结果 全文搜索引擎 搜索引擎网络公司 通过浏览器软件访问 建立索引数据库URL 自动从网上“抓取”网页,返回URL 在索引数据库中搜索排序 用户查询 获取相关信息的源位置(URL) 全面了解网上信息资源 查找非常具体或特殊的问题 浏览某方面的信息或专题 温馨小提示 没有自己的数据库 方便简单快捷 可以同时使用多个搜索引擎 元搜索引擎 返回信息多,需用户筛选结果 信息及时又多 全文搜索引擎 需人工介入,维护量大,信息量大,更新不及时 收录网站质量高 全人工审核 目录搜索引擎 缺点 优点 搜索引擎 搜索引擎的特点 小结: 因特网上的信息检索练习题.xls 网络信息资源按照主题分

文档评论(0)

xiaofei2001129 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档