第6章 Internet网络信息存取new.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章 Internet网络信息存取new.ppt

第6章 Internet 网络信息存取 ?网络信息存取原理与方法 ? Internet 网络存取系统及其检索 ?网络信息检索策略与技巧 6.1 网络信息存取原理与方法 6.1.1 网络信息检索的特点 ? 存取范围覆盖Internet 上的几乎所有资源 ? 传统检索方法与全新检索技术相结合 超文本检索 ? 用户界面友好且操作方便 C/S结构 信息反馈功能和瞬间响应功能 ? 具备良好的导航和编辑功能 ? 用户透明度 屏蔽物理差异 6.1.2 网络信息检索一般方法 ? 浏览检索 偶然发现信息 不可预见性 ? 通过资源指南(Resource Guide 来查找相应的信息 网上虚拟图书馆 利用网络信息检索工具 ? RSS订阅(Really Simple Syndication) 共享信息 ? 使用搜索软件 ? 充分利用E-mail获取信息资源 网络信息存取工具 网络信息检索工具:在因特网上提供信息检索服务的计算机系统。 检索对象:存在于因特网信息空间中各种类型的网络信息资源。 搜索引擎:以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。由搜索器、索引器、检索器、用户接口组成。 搜索器:在互联网中漫游、发现和搜集信息。 从一个起始URL集合开始,顺着超链线路以宽度优先、深度优先或启发式方式循环地在互联网中发现信息。 将Web空间按照域名、IP地址或国家域名划分,每个搜索器负责一个空间穷尽搜索。 索引器:目录索引库或数据库。认识理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。 客观索引项与内容索引项 集中式索引与分布式索引 检索器:根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。 用户接口 作用:用于输入用户查询、显示查询结果、提供用户相关性反馈机制。 目的:方便用户使用搜索引擎,高效率、多方式地从搜索引擎中得到有效、及时的信息。 6.1.3 网络信息存取工具 ? 搜索引擎的构成 6.2 Internet 网络存取系统及其检索 6.2.1 关键词检索工具的性能和使用 ?英文搜索引擎介绍 ?Alta Vista Alta Vista 是资格最老的搜索引擎,1995年诞生于DEC研发中心,是目前最受欢迎的网络信息检索工具之一。它以搜索功能强大、响应速度快和信息量丰富而著称。 注:由于种种原因,目前国内用户无法直接访问AltaVista。 Excite 特色:概念搜索:首先将检索词按字意自动扩展或加以限定,然后根据“智能概念抽取”技术查找相关的文献。 数据库规模和范围:有包含5500万网页的新闻组数据库,每天搜索300个新闻媒体,精选了6万多站点供检索。 支持目录检索和关键词检索,有基本检索和高级检索(search home里边):基本检索支持关键词、词组和自燃语言检索。自燃语言检索越详细越好。支持“+”和“-”,布尔操作符,括号,还可进行组合检索,能对语言、国家、域名进行限制。 结果显示:支持按日期和出版物排序,结果包括相关得分、题名、摘要、URL,也可只显示题名,还可在灭国中用“like this”检索。 更新:1到2周。 评价:便于简单查询,摘要可读性强,当相关性排序质量一般,搜索出的结果不能指明其格式和文件大小。 Lycos 特色:功能强大,无所不有的搜索引擎,在欧洲、亚洲、美洲的35个国家和地区设置了镜像站点。(主页如下页所示) 规模和范围:利用多个数据库提供关键词和分类主题查询以及其他服务。高级检索利用Fast数据库(3.4亿个网页),自身的目录指南包含5000万网页。 检索功能:简单和高级检索。用“+”“-”表示要求和排除,缺省是and。高级检索不支持布尔运算符,但用下拉菜单选择检索任何词或精确匹配等。字段限制检索有题名、URL、主机名或域名。可选对象有:所有书、web、城市、软件、FTP检索、多媒体、新闻、股票等包含25种语言。不去分大小写。 结果显示:按照流行网站、web网站、新闻的顺序列出,可进行再搜索,结果包括题名、摘要、URL。 更新:2~4周。 评价:搜索图像和声音文件功能较强;优点在于使用简便、排序功能好、查准率较高。缺点是结果重复率较高,有死链接。 HotBot 特色:1996年5月推出的搜索引擎,1998年10月被Lycos收购。是一个提供最新最全面信息服务的门户网站。 规模和范围:数据库包含有1.1亿个网页,主题分类目录有专家维护。除检索web页面、新闻讨论组之外,还有股票、电子商务、新闻、商业信息服务等。 检索功能:简单和高级检索。简单检索利用下拉菜单可选择利用单词、短语、题名、人物、URL、布尔检索,可

文档评论(0)

xinshengwencai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5311233133000002

1亿VIP精品文档

相关文档