第四章www浏览与信息搜索解读.pptVIP

  1. 1、本文档共90页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章 WWW浏览与信息搜索 4.1.1 概述 万维网WWW (World Wide Web)并非某种特殊的计算机网络。万维网是一个大规模的、联机式的信息储藏所,英文简称为Web。 万维网以客户服务器方式工作。上面所说的浏览器就是在用户计算机上的万维网客户程序。万维网文档所驻留的计算机则运行服务器程序,因此这个计算机也称为万维网服务器。客户程序向服务器程序发出请求,服务器程序向客户程序送回客户所要的万维网文档。在一个客户程序主窗口上显示出的万维网文档称为页面(Page)。 怎样标志分布在整个因特网上的万维网文档? 4.1.2 统一资源定位符URL URL的一般由以下四部分组成,(注意:在URL中的字符对大写或小写没有要求): <协议>://主机:端口/路径 用何协议实现万维网上各种超链的链接? 4.1.3 超文本传送协议HTTP 1.HTTP的操作过程 WWW服务使用的通信协议是超文本传输协议(HTTP,Hyper Text Transfer Protocol),它是客户端和WWW服务器之间相互通信的协议。 HTTP协议定义了浏览器(即万维网客户进程)怎样向万维网服务器请求万维网文档,以及服务器怎样把文档传给浏览器。 用户用鼠标点击了屏幕上的一个可选部分。它使用的超链接URL是/bkzsw/index.html。 用户点击鼠标后所发生的事件 (1)浏览器分析超链接指向页面的URL。 (2)浏览器向DNS请求解析的IP地址。 (3)域名系统DNS解析出清华大学服务器的IP地址为36。 (4)浏览器与服务器建立TCP连接(在服务器端IP地址是36,端口是80) (5)浏览器发出取文件命令:GET/bkzsw/index.html。 (6)服务器给出响应,将文件index.html发送给浏览器。 (7)TCP连接释放。 (8)浏览器显示“清华大学院本科招生网”文件index.html中的所有文本。 2.代理服务器 代理服务器(proxy server)是一种网络实体,它能代表浏览器发出HTTP请求,又称为万维网高速缓存(Web cache)。代理服务器将最近的一些请求和响应暂存在本地磁盘中。当与暂时存放的请求相同的新请求到达时,代理服务器就将暂存的响应发送出去,而不需要按URL的地址再去因特网访问该资源。代理服务器可在客户或服务器端工作,也可在中间系统上工作。 使用高速缓存可减少 访问因特网服务器的时延 3.服务器上存放的用户信息(Cookie) 在网上购物时,一个顾客要购买多种物品。当他把选好的一件物品放入“购物车”后,他还要继续浏览和选购其他物品。因此,服务器需要记住用户的身份,使他再接着选购的一些物品能够放入同一个“购物车”中,这样就便于集中结账。有时某些万维网站点也可能想限制某些用户的访问。要做到这点,可以在HTTP中使用Cookie。 Cookie是这样工作的 当用户李四浏览某个使用Cookie的网站时,该网站的服务器就为李四产生一个唯一的识别码,并以此作为索引在服务器的后端数据库中产生一个项目。接着在给李四的HTTP响应报文中添加一个叫做Set-cookie的首部行。这里的“首部字段名”就是“Set-cookie”,而后面的“值”就是赋予该用户的“识别码”。例如这个首部行是这样的: Set-Cookie: 当李四收到这个响应时,其浏览器就在它管理的特定Cookie文件中添加一行,其中包括这个服务器的主机名和set-cookie后面给出的识别码。当李四继续浏览这个网站时,每发送一个HTTP请求报文,其浏览器就会从其Cookie文件中取出这个网站的识别码,并放到HTTP请求报文的Cookie首部行中: Cookie: 于是,这个网站就能够跟踪用李四)在该网站的活动。需要注意的是,服务器并不需要知道这个用户的姓名李四和其他的信息。但服务器能够知道用什么时间访问了哪些页面,以及访问这些页面的顺序。 管理Cookies 在网上进行过浏览的用户可以在Cookie的文件夹中看到这些Cookie文件。对于使用Windows XP的用户可在C盘的文件夹“Documents and Setting”中继续打开使用自己的“用户名”的文件夹,然后就可看到“Cookies”文件夹,里面就是存放Cookie文件的地方。用户不仅又看到Cookie识别码,而且可以看到是哪个网站发送过来的Cookie文件。 为了让用户有拒绝接受Cookie的自由,在浏览器中用户可自行设置接受Cookie的条件。例如在浏览器IE7.0中,点击工具栏中的“工具”按钮,找到“Internet选项”,再点击“隐私”,就可以看见菜单中的左边有一个可上下滑动标尺,

文档评论(0)

琼瑶文档 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档