- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种多业务web缓存器的实现
0 web文件存储机制
缓冲区存储技术是使所需数据更接近存储区域的技术。通过将频繁请求的对象保留在本地服务器中,能明显地减少网络延时和满足用户对网络带宽的需求。目前,Web 缓冲存储器技术已经成为Internet基本结构中的重要组成部分。
与传统的内存缓存一样,Web缓存的一个关键性问题是缓存内容的替换策略。现有的大多数代理缓存器是基于传统内存页调度机制来实现的,在Web环境中却不是一个好的替换策略。其原因是Web文档大小的可变性很大且必须在Internet上传输,会经历很大延迟,而在内存缓存中,缓存对象(页)的大小和通信延迟都是不变的;另外,Web文档的访问来自不同用户,应该考虑不同用户的兴趣度。因此,本文提出了一种基于对象角色的替换算法,该算法综合考虑了文档的大小、访问代价、访问频率、最近一次被访问的时间以及访问兴趣度,通过实验对性能指标进行测量,验证了该方法优于其他文献的方法。
1 是否可以删除小文件。主要有以下几种
一个好的代理缓存的替换策略来源于对WWW业务访问特性的深刻认识,因此目前所提出的替换策略大部分来源于对WWW 访问特性的分析。
a)LRU(least recently used)算法。删除缓存中最近、最少使用的文档。算法实现简单,但没有考虑文档的尺寸和访问代价等。
b)LFU(least-frequently-used)算法。最先移出缓存中最少使用的文档,其优点是很简单,其缺点除了LRU 的缺点以外,如果没有失效机制,可能使过时的文档永远留在缓存器里。
c)SIZE算法。删除缓存中尺寸最大的文档,删除大的文档可以缓存更多的小文档,从而提高缓存命中率。其缺点是字节命中率偏低,可能会使得小文档永远留在缓存中。
d)Hybrid算法。主要目标是降低总的访问延迟,通过一个函数来计算每一个文档的替换权值。在进行替换操作时,删除具有最小替换权值的文档,而来自服务器s的文档p的函数值为
F=(cs+wbbs)(np)Wnzp(1)F=(cs+wbbs)(np)Wnzp(1)
其中:cs是与服务器s连接的代价;bs是到服务器的带宽;np是文档p的请求次数;zp是文档p的尺寸;wb和wn是常量。该算法综合考虑了文档的尺寸、文档的访问代价以及文档的访问频率等,但最大的缺点是参数计算复杂。
e)Greedy dual-size算法。由最近最少使用算法LRU发展而来,该算法对每一存储在Web缓存中的文档p设置了一个关联权值H,当需要将某文档存储到Web缓存时,初值H被设置为1/size(总为正值);当进行替换时,具有最低H值的文档将被替换,同时所有存储在缓存中的文档H值减去某一最小值(被替换文档的H值);如果文档被再次访问,则其H值恢复为初值。因此,最近使用的网页将比长时间未用的网页具有更大的H值,通过时间的推移逐渐减小H值并在网页再次被存取时恢复。其缺点是没有考虑文档使用率和网络延迟。
2 缓慢机程序实现
现有算法大多基于传统内存缓存算法,虽在实际中取得了一定的效果,但均存在不足之处。
a)对不同站点的文档考虑不足。例如,设缓存器中有两个大小相同的文档a和b,a来自用户感兴趣的、经常访问的站点Sa,b来自用户很少访问的网站Sb,经过一段时间的访问,两个文档的替换权值H相等,当有替换发生时,应尽量将文档a留在缓存存储器中,目前的算法并不能做到这一点;其次,同一个Web站点,不同的缓存器有着不同的访问量。通过分析得出,每一个缓存器一般存在着固定的用户群体,用户经常使用相同的缓存器去访问他们感兴趣的网站,不同的用户对不同的Web站点有着不同的兴趣度,从而不同的缓存器对不同的Web站点访问兴趣度也不同。
b)没有考虑文档最近一次访问的时间。例如有一个文档虽然它的访问次数很大,而其权值也比较大,但是由于近期内没有被访问,依据Web访问的时间局部性可知在将来的一段时间内可能访问不到,那么它的存在就会阻止其他的文档进入缓存。
针对以上问题,本文综合考虑Web文档对象特性,将每个文档赋予不同的角色,把文档的大小、访问频率、访问兴趣度、最近一次被访问的时间以及访问兴趣度作为角色的属性,每个角色根据其所具有的属性计算其价值。本文提出的算法根据每个文档的角色值R(p)来评估Web文档的价值。
2.1 膨胀因子p
当某文档被再次点击时,增加R(p)值,使其大于新进入文档r的权值,即R(r)R(p)。定义文档的权值公式为
R(p)=L+d(p)×c(p)/s(p) (2)
其中:c(p)为文档p的开销(下载时间、占用频带宽等);s(p)为文档p的大小;d(p) 为文档p的访问次数;L为一个膨胀因子。
为防止被多次点击的文档权值过大,应设置d(p)的最大值maxd,这一设置可以防止早期文档永久地保留在缓存池中,m
您可能关注的文档
- 20012005年象山县出生围产儿监测结果分析.docx
- 2006年7月4日文安地震前天津及邻近地区的预测.docx
- rsacache计攻击原理及实现.docx
- ruhof多酶清洗液在内镜中的应用.docx
- ruhof多酶清洗液在内镜中的应用效果.docx
- sdrsdram访问控制设计与实现.docx
- 《柳如是尺牍》之我见.docx
- 《第二性》中女性的他者形象.docx
- 一种多任务环境下的磁盘阵列适配算法.docx
- 一种多处理式cache技术.docx
- 外研版选择性必修第三册 Unit 3 War and peace Starting Out & Understanding Ideas课件(共37张PPT).pptx
- 第14课 第一次世界大战与战后国际秩序 授课课件(共31张PPT).pptx
- 第18课 科技文化成就 课件(共19张PPT).pptx
- 人教版(2025) 必修第三册 Unit 2 Morals and Virtues Listening and Speaking课件(共22张).pptx
- 第20课 狼 课件(共35张PPT).pptx
- 外研版选择性必修 第三册Unit 2 A life’s work Starting out课件(共17张PPT).pptx
- 北师大版(2025) 必修第三册 Unit 8 Green Living Lesson 1 Roots and Shoots Lesson1课件(共23张PPT).pptx
- 北师大版(2025)必修第一册Unit 1 Life Choices Topic Talk 课件(共14张).pptx
- 人教版(2025) 必修第一册 Unit 1 Teenage Life Reading and Thinking 课件(共14张PPT).pptx
- 人教版(2025) 必修第一册 Unit 2 Travelling Around Listening and Talking课件(共16张PPT).pptx
最近下载
- 大数据数据分析项目实践报告.doc
- Unit 6 Electricity everywhere 第4课时 Writing 教学设计 沪教版英语七年级下册.docx
- 防爆电气设备安装与检验考核试卷.docx
- 情态动词-专题课件(共28张课件).ppt VIP
- 《GB 50318-2017城市排水工程规划规范 》最新解读.pptx
- 河南水投集团所属公司招聘笔试真题2024 .pdf
- Unit 2 Travelling Around 大单元整体教学设计-高中英语人教版必修第一册.docx
- 义务教育生物学课程标准(2022年版).docx
- 新人教版一年级数学下册应用题练习带答案(全套).pdf
- 汉字与服饰文化(文字学).ppt VIP
文档评论(0)