计算机基础与应用——02网络信息检索.pptVIP

计算机基础与应用——02网络信息检索.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机基础与应用——02网络信息检索

第二章 网络信息检索 网络检索工具是指在因特网上提供信息检索服务的一类网站或服务器,其检索的对象是存在于因特网信息空间中各种类型的网络信息。 网络检索工具主要可以分为目录型工具和搜索引擎两大类 目录型检索工具 目录型检索工具(Subject directory catalogue)是由信息管理专业人员在广泛搜集网络资源,并进行加工整理的基础上,按照某种主题分类体系编制的一种可供检索的等级结构式目录。 目录型检索工具主要优点是所收录的网络资源经过专业人员的选择和组织,可以保证质量,从而提高了检索的准确性。但是由于人工收集整理信息,因此得花费大量的人力和时间,难以跟上网络信息的迅速发展,所涉及信息的范围有限,其数据库的规模也相对较小。 雅虎:Yahoo (/) 雅虎创建于1994年,是最早、最有代表性的目录型检索工具。 Yahoo!的中文站点()于1998年5月推出。Yahoo!将网络资源按内容分为14个大类,每个大类下又逐级链接多个小类,最后与相应的Web页相连。Yahoo!除了提供目录方式链接浏览检索外,还提供关键字检索,并具备高级检索功能。 搜索引擎 搜索引擎(Search engine)使用自动索引软件来发现、收集并标引网页、建立数据库。以网页形式提供给用户一个检索界面,供用户输入检索关键词、词组或短语等检索项。代替用户在数据库中查找出与其提问匹配的记录并返回结果,且按其相关度排序输出。 使用搜索引擎检索时,而无需判断类目、归属,使用比较方便。但由于人工干预过少,使其准确性较差,检索结果中可能会有很多冗余信息。 搜索引擎的工作原理 信息的采集与存储 加工——信息索引的建立 输出——相关性处理并建立索引界面 最后,搜索引擎检索界面用于接受用户提交的查询请求,从而进一步找寻相应的Web页地址 搜索引擎的检索功能 一般检索功能 布尔逻辑检索:“与AND”、“或OR”、“非NOT” 词组检索:将一个词组当作一个独立运算单元,进行严格匹配 。 截词检索:左截、右截、中间截断和中间屏蔽等四种,通常只提供右截法,而且搜索引擎中的截词符通常采用星号“*”。 字段检索字段检索是限制检索的一种,多表现为限制前缀符的形式。 特殊检索功能 自然语言(Natural Language)检索:直接采用自然语言中的字、词或句子提问式进行检索。 多语种检索:提供多语言种类的检索环境供检索者选择,系统可按指定的语种进行检索,并输出相应的检索结果。 ?区分大小写的检索(Case-Sensitive):主要是针对检索词中含有人名、地名等专有名词的检索。 多元搜索引擎(Metasearch engine,Megasearch engine或Unified search engin) 多元搜索引擎也称集成式搜索引擎,它是将多个搜索引擎集成在一起,向用户提供一个统一的检索界面,且将一个检索提问同时发送给多个搜索引擎同时检索多个数据库,再经过聚合、去除重复部分并输出检索结果。 二、信息检索策略 合理确定检索的关键词 采用选用适当的检索方法 分类目录检索 关键词检索 分类目录加关键词混合检索 多元引擎检索 检索结果的处理对策 常用的检索技巧 用搜索引擎检索到所需文档并连接到相关网页后,有时会发现你所要的文件并没有出现在当前屏幕中,这时简单的方法就是在该网页中使用查找功能 。 一些常用网站的网址(URL)通常是可以猜测出来的,当然首先需要我们了解URL的基本组成,在需要时就可以“构造”出这样一个网站的URL来。 在信息检索中,当一个很长的网址连接不上时,可以试试“右切断网址”的方法,从右至左依次删除网址中斜杠后面的内容,直至链接成功。 BBS BBS(Bulletin Board System / Bulletin Board Service ),即公告牌系统,利用BBS,用户可以阅读他人关于某个主题的最新看法,也可以将自己的想法贴到公告栏中。 使用BBS的方式有两种: 利用远程登录软件Telnet登录到站点 上,这种方式 使可以同时上站的用户数大大增 加。 基于WWW的BBS,用户利用网页浏览器就可以 直接使用BBS。 网络电话 网络电话即人们通常所说的IP电话,它是利用因特网实现远程话音通信的一种方式。IP电话可以分为三种方式:PC-PC、PC-PHONE、PHONE-PHONE。 资源共享 FTP FTP是文件传输协议(file transfer protocal)的缩写,是一种重要的文件传输手段。通过FTP,可以在因特网上的任意两台计算机之间互传文件,而不管这两台计算机的硬件及操作系统平台是否相同。 习惯上,我们把从远程计算机(FTP服务器)向本地计算机(客户机)传输即复制文件的过程称为“

文档评论(0)

qwd513620855 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档