- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第10届盒田计算机在现代科学技术领域应用学术会议论文集
Mod日n
Sden∞TI|c|期oIogy
ChI咱S”1p∞hn锄C唧^管Applb蚰∞h
Pr。c∞dn驴of竹一10lh
基于网关的分布式wwW系统构建
徐臻青许榕生
(中国科学院高能物理研究所计算中心。北京,100039)
针对现有的单机集中式web量务嚣在处理大量客户请求时的弱点.本文介绍利用分布式环境来分担系
统负t的实理方法.为此专门蛔写同关鼍务程序负麦接收客户请求,并依据当前景撬中各台成员计算机的负
t情况来分配客户请隶.舅试结果豆示-在访回量高峰朝.分布式www系坑的响懿度比单机系缱有很大
曩膏.
关■词:分布式www呆坑罔关负载 一n/。
J 一,
1 www服务器的工作模式
现在大多致的www服务嚣都采用预先派生的同时服务模式(舯eforked咖饥rnnt
∞rv目).即在服务程序初次启动的时候t派生出一定数日的子进程(都是服务程序自身的副
本),这些进程平时处于睡眠状态,当有客户的请求到来时.一些或者全部(视请求的数目而定)
的进程被唤醒.同时处理这些请求.当现有的进程数目不能满足全部的客户请求时.www服
务器会再派生出一些子进程来处理这些请求.这样做的目的是为了鳐短对每个客户请求的响
应时问,提高www服务器的整体性能.为了避免过多的子进程占用大量的系统资源.一般同
时存在的子进程致目会有一个上限.而且当空闲的子进程数目达到某个预先设定的值时.
www服务器会杀掉一些子进程.只维持适当数目的子进程来处理当前或预期的客户请求.
但是在单一一台机器上同时存在很多的进程.会消耗大量的系统资源.对于一十繁忙的
www站点来说,尤为如此.系统资源(比如:CPU时间,内存数量)缺乏时。会大大降低响应时
间,给用户的感觉就是洲览速度变慢.要提高www站点的响应速度.提高单机系统的性能,
是解决问题的一条途径。但是当前的高性能服务器系统的价格惊人,而且计算机系统的更新换
代速度非常快,价格也下降得非常迅速。往往几年以后对整个系统的投资就不值钱了.而当前
个人电脑(PC)的发展非常迅速-性能逐渐向高蜷服务器产品靠拢.但是价格却不到服务器产
品的十分之一.
2分布式环境中的www系统
现在比较流行的做法是利用廉价的高挡PC机组成分布式的工作环境。来承担高档服务
器才能完成的任务.具体到www服务器来分析,比如,原来在高峰时期www服务器要派
生出150(Apache
Hr曙D的缺省上限)个子进程来同时处理客户请求.现在假定使用5台Pc
机组成的分布式环境完成这一任务。将客户请求平均分配到每一台机器上。那么每台计算机只
要维持30个子进程就可以应付高峰时期的访问量.相比之下,30个子进程占用的系统资源要
远远低于150个子进程.客户访问的高峰时期,每台计算机的响应速度会大大高于单机系统.
60
这就是分布式wWw系统的原始构想.
针对当前www服务器的典型工作方式,采用分布式的计算机环境来取代单机、集中方
式的硬件平台,是提高www站点响应速度的另一条途径.传统的www服务器只能运行在
一台计算机上,还没有出现能够直接在分布式环境中运行的版本.要想利用分布式环境来提高
www站点的响应速度,使现有的www服务器能够利用分布式环境的资源优势,现在有两
种方法可以实现.最简单的方法是采用旋转木马式的域名系统(r∞nd—robinDNs),它对每一
次针对www站点的名字解析请求.都回应以分布式环境中不同机器的P地址,这样客户可
以直接与不同的计算机连接.从而把整十站点的负担,均匀分配给许多机器,其缺点是不知道
各个成员计算机的负载情况.很容易产生超载现象.另一种是编写www的阿关程序·该程序
集中收集所有的客户请求.并且依据当前分布式环境中各个机器的负载状况,台理分配每个请
求给负载最轻的机器.
3网关服务程序
在HrrP的协议说明中.我们看到在服务器(serv口)和客户(Cli∞t)之间可以存在两类中
介程序:一是代理(Proxy).它用于客户一端的请求中介.代理服务在www的应用中比较常
文档评论(0)