医学五年制检索课-第4章 网络搜索引擎教学材料.pptVIP

  • 2
  • 0
  • 约5.14千字
  • 约 47页
  • 2018-10-17 发布于天津
  • 举报

医学五年制检索课-第4章 网络搜索引擎教学材料.ppt

医学五年制检索课-第4章 网络搜索引擎教学材料.ppt

第4章 搜索引擎;何为搜索引擎?; 搜索引擎是指以人工或网络机器人软件的方法采集、标引Web资源和其他类型的网络资源,并将索引信息内容存储于大型数据库中,以Web网站的方式提供给网络用户查询的信息服务系统。;第4章 搜索引擎;索引式搜索引擎 目录式搜索引擎 元搜索引擎 ;索引式搜索引擎 也称为机器人搜索引擎,主要采用机器人技术,通过“机器人”(Robot)、“蜘蛛”(Spider)、“爬虫”(Crawler)等去网上抓取各个网站、网页的信息,自动化程度高的搜索引擎还利用计算机辅助数据库的建设,如进行自动分类、自动标引、自动文摘等。在前台提供一个检索入口,用户通过检索入口递交查询请求,通过后台对数据库的检索操作将结果反馈给用户,相当于网上资源的主题索引;索引式搜索引擎的主要特点是: 1.?交互性更强,集中体现了客户机/服务器模式的优势。 2.? 检索功能强大??一般可进行布尔逻辑检索、词组检索、位置检索、截词检索等 3.? 提供二次检索,允许在查询结果中进一步限定,从而缩小检索结果范围,提高查准 率。 ;目录式搜索引擎 又称目录导引式搜索引擎,主要是指由人工发现、抓取、辨别网上信息,依靠编目、标引人员的知识,按照图书分类、学科分类或其他分类依据,建立主题树分层目录,并将采集、筛选后的信息分门别类地放入各大类或子类下面。在Web页面上呈现出错落有致的上下位关系,用户通过层层点击,顺链而行,随着范畴的缩小与查询的专指度提高,最终满足用户的查询需求。;目录式搜索引擎的特点 1.比较适合主题浏览、一般主题检索或为用户检索提供有价值的提示,而且通过这种体系分类来归整资源,体现了知识概念的系统性,有利于族性检索。 2.查准率高。一方面人工技术的干预;另一方面用户参与程度高. 3.查全率有限。信息涵盖量不大,更新能力有限是这类检索引擎的一个弊端。 4.分类依据的科学性与标准性。对于这一类搜索引擎,分类标准是其提供优质检索服务底重要保障之一。 ;目录式搜索引擎与索引式搜索引擎的主要区别在于: 1.目录式搜索引擎的数据库是依靠人工建立起来的,索引式搜索引擎的数据库是用程序自动搜索和积累的。 2.由于目录是依靠人工进行整理搜索,而且只在保存的对站点的描述中进行搜索,因此站点本身的动态变化不会反映到搜索结果中来,其网站信息的更新速度受到一定影响。 3.由于目录是依靠人工来评价一个网站的内容,因此用户从目录搜索得到的结果往往比索引式搜索引擎得到的结果更具参考价值。 ; 网上信息的急剧膨胀往往是单个独立搜索引擎的检索能力所难以招架的。任何一个搜索引擎都不可能100%的覆盖网上信息。据专家评测,目前主要搜索引擎返回的相关结果的比率不超过45%,而且由于机制、范围、算法等差异,导致同样一个查询请求在不同的搜索引擎中的检索结果的重复率不足34%。因此,要想获得一个比较全面、准确的结果,就必须反复调用多个搜索引擎。于是,元搜索引擎应运而生,在一定程度上解决了搜索引擎的这些问题。 元搜索引擎(Metasearch Engine),被称为搜索引擎之上的搜索引擎,是一个要调用其 他搜索引擎的搜索引擎。 ;元搜索引擎的主要特点 1.查全率大大提高,但查准率更难保障; 2. 一般只支持AND、OR、NOT等简单的操作; 3. 运作机制有别于目录式和索引式; 4.元搜索引擎需要与各个收录的搜索引擎网站建立协作关系,拥有对方数据库的访问权。 ;第4章 搜索引擎;Google () Hotbot () Yahoo! () Baidu() ;Google 1.概况 Google是由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年 9月发明,并于1999年创立了Google公司。 Google 的使命就是要提供网上最好的查询服务,促进全球信息 的交流。Google 开发出了世界上最大的搜索引擎,提供了最便 捷的网上信息查询方法。通过对 多达一万亿网页进行整理,可 为世界各地的用户提供适需的搜索结果。 Google 是由英文单词“googol”变化而来。“googol”是美 国数学家 Edward Kasner 的侄子 Milton Sirotta 创造的一个词, 表示 1后边带有 100 个零的数字。Google 使用这个词代表公司 想征服网上无穷无尽资料的雄心。 ;2.特点及技术支持 (1)特点 Google支持多语言检索,包括简体中文和繁体中文; Google网站只提供搜索引擎功能,没有花里胡哨的累赘; Google速度极快,有100多万台服务器; Google的专利网页级别技术PageRank能够提供高命中率

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档