2015信息检索--2上传资料.docVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 Internet 信息检索与利用 信息检索的三个层次: 1.知道在哪里能找到信息(了解不同的信息源) 2.能从信息源中检索出合适的信息(课题分析和检索技术) 3.能对检索结果进行评价和分析(选择和综合利用) 第一节 Internet的基本知识 一、起源与发展 起源:美国国防部20世纪60年代末70年代初的 ARPANET 三个发展阶段: 1 ARPAnet,即美国国防部的计算机网络,是Internet的先驱。 2 NSFnet,美国国家科学基金会NSF在1985年资助建立的连接五大超级计算机中心的计算机网络。 3 现代Internet,向用户提供Internet商业的联网服务。 Internet在中国 1987.9中国开始使用Internet(北京计算机应用技术研究所第1封电子邮件) 1990.10中国正式注册登记了中国的顶级域名CN 1993.3中国1个内地Internet网络节点(中科院高能物理所) 1994.5中关村地区教育科研示范网NCFNET(中科院计算机网络中心),被正式承认有Internet的国家 1995.7中国教育科研计算机网CERNET开通(教育界) 1995.12中国科技网CSTNET开通(科技界) 1996.1中国公用计算机网CHINANET开通(单位个人.商业运行) 1996.9中国金桥信息网CHINAGBN开通(经济信息.商业运行) 1996年底,国内Internet互联网络已基本完成,进入商业化试运行阶段。 中国第一封电子邮件 二、相关概念 1.网络信息资源 借助于计算机网络可以获取和利用的各种信息资源的总和。也就是在互联网上传输的那部分电子信息资源。 2.IP地址和域名系统 IP地址 标识地址—称作网络协议地址; 分配给主机的一个32位地址,由4个字节组成; 分为动态IP地址和静态IP地址两种; 动态IP地址每次连线所取得的地址不同,而静态IP地址是指每次连线均为同样固定的地址,无线上网就是动态IP地址; 静态地址如学校网站的202.207.48. 0 - 55 静态地址通常一经设定,变动较少。 域名和网络地址 域名也由若干部分组成,各部分之间用小数点分开,即:计算机主机名.机构名.网络名.最高层域名,每个层次为域,各个层次之间用“.”号分隔,从左向右域层逐级上升。例如我校主机的域名是 :“”。 域名前加上传输协议信息及主机类型信息就构成了网址(URL)。 如我校www主机的URL就是:“http:// ”。 域名一般不会变动。 URL URL:UniformResourceLocator的缩写 ,统一资源定位符。也被称为网页地址,是因特网上标准的资源的地址, 是对可以从因特网上得到的资源的位置和访问方法的一种简洁的表示。 是每一信息资源在 网上的惟一地址,由资源类型、存放资源的主机域名及资源文件名组成。如:/index.html url的结构 基本URL包含模式(或称协议)、服务器名称(或IP地址)、路径和文件名。 如“协议://授权/路径?查询”。完整的、带有授权部分的普通统一资源标志符语法看上去如下:协议://用户名:密码@子域名.域名.顶级域名:端口号/目录/文件名.文件后缀?参数=值#标志 URL的模式/协议(一) 最常用的模式是超文本传输协议(Hypertext Transfer Protocol,缩写为HTTP),这个协议可以用来访问网络。其他协议如下: http——超文本传输协议资源 https——超文本传输的安全版,有加密(支付交易) ftp——文件传输协议 双向传输。 mailto——电子邮件地址 ldap——轻型目录访问协议搜索 file——当地电脑或网上分享的文件 news——Usenet新闻组 gopher——Gopher协议,某种索引 telnet——Telnet协议,远程登录。 URL的模式/协议(二): 文件所在的服务器的名称或IP地址,后面是到达这个文件的路径和文件本身的名称。服务器的名称或IP地址后面有时还跟一个冒号和一个端口号。 HTML HTML file:超文本文件, HTML是Hyper Text Markup Language的缩写,最大的特点是存在链接功能,可以从网页上的某一点直接指到另一个地方。 超文本标记语言 ,是用于描述网页文档的一种标记语言。 是标准通用标记语言下的一个应用,也是一种规范,一种标准,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容(如:文字如何处理,画面如何安排,图片如何显示等)。对于不同的浏览器,对同一标记符可能有不完全相同的解释 ,因而可能会有不同的显

文档评论(0)

1192212 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档