网站大量收购独家精品文档,联系QQ:2885784924

第十二章a 网络信息检索.ppt

  1. 1、本文档共101页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网络信息检索 信息检索的三个层次 知道有哪些信息源(了解不同的信息源) 能从信息源中检索出合适的信息(课题分析和检索技术) 能对检索结果进行评价和分析(选择、综合利用) 网络信息资源概念、类型、特点 怎样检索合适的信息 如何对检索结果评价 一 网络信息资源概念、类型、特点 1.1 概 念 网络信息资源是指信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的总和。 1.2 网络信息资源的类型 按信息内容的表现形式和内容划分可分为 全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等; 事实型信息:天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等; 数值型信息:主要是指各种统计数据; 数据库类信息:如DIALOG,维普等,是传统数据库的网络化; 微信息(web2.0特征):如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等。 其它类型:投资行情和分析,图形图象,影视广告 WWW网络资源:因特网信息资源的主流,它使用http协议,使用简单,功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。 FTP信息资源:它使用ftp协议,该协议主要用于连网计算机之间传输文件。FTP相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件和长文件的主要方法。 TELNET信息资源:telnet是远程登陆协议。telnet信息资源包括硬件资源和软件资源。许多机构都提供远程登陆的信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统等。 用户服务组资源:包括新闻组,电子邮件组等。这些电子通信组形式所传递和交流的信息资源是网络上最自由、最具有开放性的资源。 1.3 网络信息资源的特点 复杂性:网络信息资源具有大数量、多类型、多媒体、非规范、跨时间、跨地域、跨行业、多语种等特点。 在很大程度上网络的增长和信息资源的动态快速增加是由用户驱动的,但缺乏有效的统一管理机制,信息安全和信息质量的不均衡性。 信息分布和构成缺乏结构和组织,信息源不仅分散无序,而且其更跌和消亡也往往无法预测,因此增大了信息资源管理和利用的难度。 信息发布具有很大的自由性和任意性,隐私型信息进入了公共信息传播渠道;由于缺乏必要的过滤、质量控制和管理机制,不仅学术信息、商业信息,政府信息、个人信息、不合适(反动、黄色)的信息混为一体,质量良莠不齐。增加了信息识别和利用的难度。 正式出版物和非正式信息交流交织在一起,使传统的人类信息交流链的格局被打破,各方在网络上既可以是信息的生产者、发布者,也可以是传播者和使用者,对学术交流环境和信息利用产生了深刻的影响。 使用成本低 共享程度高 是信息资源的宝库…… 1.1 认识IP地址 人们为了通信的方便给每一台计算机都事先分配一个类似我们日常生活中的电话号码一样的标识地址,称作网络协议地址,是分配给主机的一个32位地址,由4个字节组成。分为动态IP地址和静态IP地址两种。动态IP地址指的是每次连线所取得的地址不同,而静态IP地址是指每次连线均为同样固定的地址。如在图书馆无线上网就是动态IP地址,每次所取得的地址不同。 静态地址如学校网站的IP 通常一经设定,变动较少。 1.2 网络地址和认识域名 虽然可以通过IP地址来访问每一台主机,但是要记住那么多枯燥的数字串显然是非常困难的,为此,Internet提供了域名(Domain Name)。 域名也由若干部分组成,各部分之间用小数点分开,例如:“”。 域名前加上传输协议信息及主机类型信息就构成了网址(URL),例如: “http:// ”。 通常,进行网络访问时,域名的www可以省略。如/,可以直接输入。不能省略的与域名服务器的配置有关。 域名一般不会变动。 1.3 网络地址---网址---URL 网络地址是URL(Uniform?Resource?Locator)的俗称,一般由三个部分构成,各个部分如下: ?服务器标识符   通过选择服务器标识符能够确定将要访问的服务器的类型,URL中的服务器标识符可以有HTTP://、FTP://、GOPHER://、TELNET://、NWES://等等类型,分别指定为采用超文本传输协议连接、采用文件传输协议连接、与GOPHER服务器连接、与TELNET会话连接、与USENET新闻组相连接。 信息资源地址   信息资源地址是由两部分构成的,一是机器名称,如是用来指示资源所存在的机器,另一个是通信端口号,如HTTP的标准端口号为80,TELNET的标准端口号为23,FTP的标准端口号为21等等。 路径名  路径名是给出资源在所在

文档评论(0)

xx88606 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档