第三章网络信息索与利用.ppt

  1. 1、本文档共141页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
 第三章 网络信息检索 第一节 Internet 的基本知识 第二节 搜索引擎概述 第三节 搜索引擎使用技巧和介绍 第四节 网络免费学术信息检索 Internet 的基本知识 Internet三大基本应用 Internet需要具备的条件 Internet中的基本概念和术语 Internet三大基本应用 1.远程登陆(TELNET) 2.电子邮件发送或接收信息(E-MAIL) 3.文件传输通过文件传输协议(FTP), 实现推拉式服务. Internet需要具备三方面的条件 Internet中的几个基本概念和术语 搜索引擎(Search Engines) 是一种利用网络自动搜索技术,对因特网各种资源进行标引,并为检索者提供检索的工具。人们常把搜索引擎称之为网络之门,它包括万维网搜索引擎、新闻论坛搜索引擎、黄页搜索引擎、元搜索引擎等多种类型的搜索引擎,数量已达数百种。 第二节 搜索引擎概述 搜索引擎,英文为Search Engine,是一个对互联网信息资源进行搜索整理和分类,并储存在网络数据库中供用户查询的系统,包括信息搜集、信息分类、用户查询三部分。目前流行的搜索引擎有两大类:分类目录式搜索引擎和关键词全文检索式搜索引擎。 一、搜索引擎的概念、检索原理及特性 二、搜索引擎的类型 三、Internet的主要信息服务类型 一、 搜索引擎的概念、检索原理及特性 引擎是英文“Engine”的音译词,意为发动机。一般将其定义为:“是一种用于帮助Internet用户查询信息的搜索工具,它以一定的策略在Internet中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的”。它是搜索引擎和搜索目录(Search Directory)的统称,其实也是一个网站,只不过这样的网站专门提供信息“检索”服务,它使用特有的程序将Internet上的信息进行搜集、整理和归类,以帮助人们在浩如烟海的信息海洋中搜寻到各人所需信息。 搜索引擎的工作原理 搜索引擎的检索特性 二、搜索引擎的类型 目前流行的搜索引擎有两大类: (一)目录式搜索引擎 (二)全文检索式搜索引擎 (三)元搜索引擎 英文YAHOO!主页 “Science”的详细类目 ”Biology”的下位类目 “Biotechnology”下位类目 “Biotechnology”中”Genetic Engineering”的下位类目及相关网络信息 (二)关键词全文检索式搜索引擎 关键词全文检索式搜索引擎利用其内部的搜索机器人Spider (蜘蛛)程序,自动搜索互联网上大大小小的网站内容,储存在其网络服务器的数据库中,用户只要输入关键词就可以找到符合该关键词特征的所有被索引的网页,并以超级链接的方式对搜索结果列表,点击相应的链接就可以进入相应的网络资源网站,从而找到所需信息。相关性越高的信息,在搜索结果列表中的位置越靠前。关键词全文检索式搜索引擎的代表是Google、百度、AltaVista等就是全文式搜索引擎。 最大的中文搜索引擎百度 Google主页 Google及其使用 Google 是由英文单词“googol”变化而来,表示 1 后边带有 100 个零的数字,代表Google想征服网上无穷无尽资料的雄心 世界上最大的搜索引擎。通过对 30 多亿网页进行整理,提供搜索结果,而且搜索时间通常不到半秒 有基本搜索和高级搜索两种方式。 Google及其使用 检索特性 两词之间用空格表示“AND” 支持短语搜索 ,用“” 对拼音关键词能进行自动中文转换 不支持“词干法” 可以查找 某种格式的 文件,如关键词后加上filetype:pdf,便可检索到PDF格式的文件 中英文单词互译:只需输入一个关键词(“翻译”,“fy” 和“FY” 任选其一)和要查的中 (英) 文单词,Google返回的网上字典链接即刻便可知道检索词词的英文(或中文)翻译。 也可利用 Google 目录根据主题来缩小搜索范围 高级搜索界面 (三) 元搜索引擎(Meta-search Engine) 是在搜索引擎基础上建立的可以同时查询多个搜索引擎的WWW站点,其英文原意是搜索引擎之后或之上的搜索引擎,因而也可以叫做后搜索引擎。虽然元搜索引擎依赖其他独立搜索引擎而存在,但它们集成了不同性能和不同风格的搜索引擎并发展了一些新的查询功能,查一个元搜索引擎就相当于查多个独立搜索引擎,可以收到事半功倍的效果,故值得选用。 ProFusion主页 检索结果界面 著名元搜索引擎 Mamma ( ) 1996年面世,自称为“搜索引擎之母”的并行元搜索引擎,可同时调用7个最常用的独立搜索引擎,并且可查询网上商店、新闻、股票指数、图像和声音文件等资源。其特点

文档评论(0)

lanhe8975915 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档