文献信息检索与利用-东华大学.ppt

  1. 1、本文档共147页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文献信息检索与利用-东华大学

文献信息检索与利用 第二章 网络信息检索 第一节 概述 一、产生 网络检索是基于Internet的信息检索方式。 网络检索是在计算机检索的基础上发展起来的:单机或局域网络检索——分布式的信息检索——网络检索 网络信息检索:利用Telnet、FTP、E-mail、 Gopher、WWW等信息传输协议和检索工具,在Internet等网络上进行信息存取的行为。 二、网络检索的特点 1、交互式作业方式; 2、用户透明度; 3、信息检索空间的拓宽; 4、友好的用户界面。 第二节 网络信息资源 Network Information Resources:以数字形式记录,以多媒体方式表达,存储在网络计算机磁介质、光介质及通信介质上的信息集合。 从目的上看是“为了提高信息系统效率,实现资源共享而采用计算机网络整理、传递、获取的各种信息”, 一、网络信息的种类 1、按照网络信息的内容划分 1)网络数据库 2)联机馆藏目录库 3)电子出版物 4)政府机构信息 2、按照所采用网络信息协议不同划分 1)基于超文本传播协议(HTTP)的信息资源 万维网(World Wide Web简称WWW或Web)信息资源是一种典型的基于HTTP的网络信息资源。Web建立在超文本、超媒体基础上,集文本、图形、图像、声音为一体,并以直观的图形用户界面展现和提供信息的网络信息资源形式。 URL(Universal Resource Locator):“统一资源定位器”,即我们通常所说的网址,包括协议、主机、目录、文件部分。 /inqs/upfile/1/2007yishu.htm 2)基于文件传输协议(FTP)的信息资源 主要功能是完成从一个系统到另一个系统完整的文件复制,即在网络的联网计算机之间传输文件。任何计算机方式存储的信息均可通过FTP协议获取。 3)基于远程登录(Telnet)的信息资源 通过Telnet协议所访问到的网络信息资源。实现方法为在远程计算机登录,使自己的计算机暂时成为远程计算机的终端,进而实时访问、使用远程计算机中对外开发的资源。 二、网络资源的特点 1、从内容上看 1)数量海量化 2)种类繁多 3)分布开放,但内容之间关联程度强 4)信息庞杂,不易控制 2、从形式上看 1)非线型 2)交互性 3)动态性 3、从效用上看 1)共享性 2)时效性 第三节 网络检索工具 一、搜索引擎的定义 是指对英特网各种信息资源进行标引和检索的工具。搜索引擎使用自动搜索软件来采集、发现、收集并标引网页、建立数据库,以WWW形式提供给用户一个检索界面,用户通过关键词、词组或短语等检索项来进行检索。 获取更多定义:define:搜索引擎 二、工作原理 1、信息的采集与存储:人工采集和自动采集(自动索引软件Spider、Robot、Worm) 2、建立索引数据库 3、检索界面的建立 三、搜索引擎的基本检索功能 1、布尔逻辑检索 (1)逻辑与关系,用关系词AND表示 (2)逻辑或关系,用关系词OR表示 (3)逻辑非关系,用关系词NOT表示 2、词组检索:一般用“”括起 3、截词检索:用截词符*来代替相关字符,常用右截断。如输入comput* 4、字段检索:网络检索特征的字段,如主机名、域名、统一资源定位地址(URL) 5、自然语言检索 6、多语种检索 7、区分大小写检索 四、搜索引擎的类型 1、全文检索型搜索引擎: 处理的对象是互联网上所有网站上的每个网页,采用自动搜索软件,是真正的搜索引擎。用户获得的检索结果,不是最终结果,而是检索线索。检索面广,信息量大,信息更新速度快,适用于主题词检索。缺点是检索准确性低,效率不高。 2、分类目录型搜索引擎 先由人工搜集网络资源并编制目录。首先把网站类别进行类别划分,并只收录摘要信息。 优点是可以保证信息质量,提高检索的准确性,不足之处是人工量大,信息量少。 3、多元搜索引擎 又称集合式搜索引擎,是将多个搜索引擎集成在一起,向用户提供一个检索界面。 有点是省时、全面性好。 (比比猫):网页数据库来源于五大搜索引擎Google、雅虎、百度、iAsk以及搜狗。 第四节常用中文搜索引擎 一、Google搜索引擎 1、基本情况 由斯坦福博士生佩奇和布林于1998年9月创办。最优秀的支持多种语言的搜索引擎,功能强大,特点突出,服务优良。 采用自动搜索软件网络蜘蛛(Spider),并采用先进的网页级别(PageRank)技术。 2、 Goo

文档评论(0)

ailuojue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档