INTERNET信息检索和利用.pptVIP

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
INTERNET信息检索和利用

Internet 信息检索与利用;Internet 的基本知识;Internet三大基本应用; 1.方便客户端的访问——设置统一 浏览器(www 或称Web浏览器); 2.网上计算机都能通用——设置统一 标注语言(HTML超文本标注语言); (超文本语言——浏览器与服务器之间的一种通讯协议) 3.全世界统一的页面指针——URL统一资源定位格式。 ;1.调制解调器(MODEM): 戏称“猫”,是上网必需的设备。它可以将计算机的数字信号转换(调制-Modulation)成模拟信号,通过电话线路传送到另一台计算机(比如服务器)上,接受端用它的 Modem 将其还原(解调-demodulation)为计算机能识别的数字信号,从而实现双方的信息交换; 2.服务器(SERVER): 一台功能强大的计算机,有较高的速度、较大的存储空间以及断电保护措施等。它能够在网络中为用户提供通讯、文件共享、网络打印等功能。 ; 3.WWW (World Wide Web): WWW 是一个基于超文本方式的信息检索工具,它为用户提供了一种友好的信息查询接口,是 INTERNET 上的信息服务系统。它把 INTERNET 上不同地点的相关信息聚集起来,通过 WWW 浏览器(又叫做 WEB 浏览器)检索它们,无论用户所需的信息在什么地方,只要浏览器为用户检索到之后,就可以将这些信息(文字、图片、动画、声音等)“提取”到用户的计算机屏幕上。WWW 采用了超文本链接,你只需轻轻点击鼠标,就可以很方便地从一个信息页转移到另一个信息页; 4.主页(HOMEPAGE ): 全称应该是 WWW 主页。它指的是 WWW 服务的起始装入信息页,是 WWW 用户可以看见的第一信息界面,你连接到主页后,除了可以直接在主页了解到主页制作者的一般信息外,还可以可以又进入到另外的一个画面再进一步地获取到更多的信息。也就通过主页上定义的超级链(hyperlink)访问网页。 ; 5.电子邮件(E-MAIL): 这是一种最常用的 INTERNET 功能,也是一种最便捷的利用计算机和通信网络传递信息的现代化手段。电子邮件的传递由 SMTP 协议来完成,网络用户可以通过 INTERNET 与全世界的INTERNET 用户收发信件。电子邮件的内容,不仅仅包含文字,还可以包含图像、声音,动画等多媒体信息.; 6.HTTP(Hypertext Transfer Protocol): 超文本传输协议。该协议经常用来在网络上传送 WEB 页。当用户以 http:// 开始一个链接的名字时,是告诉浏览器去访问使用 HTTP 的 WEB 页。 ;7.URL(Uniform Resource Locator): 统一资源定位器。是 WEB 的地址编码,WEB 上所有能访问的资源都有一个唯一的 URL 。URL 包括:所用的传输协议,服务器名称、文件的完整路径。例如:在浏览器 URL 处键入 ?就可以访问无锡信息港(无锡阿福台)了。  ; 8.IP地址(INTERNET PROTOCOL): 互联网络协议地址。INTERNET 上每台主机都有一个唯一的地址(或者叫名字),它是数字形式的一组地址,例如:00,它是计算机在网络上的数字标识,一般分为两部分:网络地址(NETID)、主机地址(HOSTID)。IP地址分为五类:A、B、C、D、E,常用的是 B、C 两类。; 10.搜索引擎(Search Engine): 搜索引擎是WWW 浏览器查询信息搜索工具, 是一个用来查询搜索世界各地 INTERNET 网络资源的 WEB 服务器。它就象一本书的目录,INTERNET 上各个站点的网址就象是页码。你可以通过关键字(keyword)或者主题分类的方式查找感兴趣的信息所在的 WEB 页面。是网上动态检索工具。 ; ;主要可概括为以下几个过程: (1)信息的采集和存储 搜索引擎一般采用自动方式收集和存储信息,即运用“网络机器人”自动运行的软件,搜索引擎追寻WWW网上的链接行进,找到Web页并将它们调出,搜索引擎将自动给Web页上的某些字或全部字作上索引,形成目标摘要格式文件后,再形成网络可访问的数据库。 ; (2)信息索引的建立 信息采集和存储后,要建立索引查询系统,它是同建库系统配套的子系统,决定索引时空比、布尔逻辑操作、表达式匹配、结构化和非结构化文件处理、词语匹配、匹配相关性排序等。 建立信息索引就是创建文档信息的特征记录,使检索者能够快速地检索到所需的信息。 ; (3)检索界面的建立 搜索引擎检索界面接受检索者提交的查询请求(包括查询内容及逻辑关系),并根据检索

您可能关注的文档

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档