- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于OpenStack云存储技术
基于OpenStack云存储技术
摘要
随着大数据时代的来临,数据信息的存储呈现出爆发式的增长,在数据挖掘、视频点播等各个领域,大数据量的存储都占据着重要的地位,对现有的存储方案和存储技术都提出了严峻的挑战。尤其是对于目前最火的互联网行业来说,数据就是它们的命脉。本文重点研究了OpenStack的存储技术,该技术是通过代理节点的方式对外提供服务,当访问量特别大时,尤其是电商网站,访问的性能会出现很大的影响,需要对负载均衡问题进行处理。本文提出了一种基于时延的迁移策略来解决该问题。
【关键词】OpenStack 云存储 代理节点 访问性能 负载均衡
1 引言
在云存储系统中,主要的操作就是I/O才做,也就是输入和输出,外部调用服务存储数据,也可查询数据。I/O任务往往都具有很大的随机性,这时就会出现有的节点超负荷工作,有的节点被闲置下来,从而就引发了负载不均衡的问题,产生了严重的性能问题。尤其是对于?商网站来说,经常会做大型的活动,每秒的访问量都有可能达到上百万次。要想解决这种问题,就需要重新分配各个节点的工作量,优化资源配置,从而提高整体的性能指标。一般来说,负载均衡有两种表现形式,一种是将大量的访问量分配到各个分服务器上进行处理,减少访问的响应时间,另一种是当某个节点负载较大时,将其任务量分配到其他的节点,降低它的工作量。
2 swift对象存储
Swift对象存储是OpenStack云计算平台的主要项目,它提供了强大的持久性云存储服务,主要用来存储长期保存的静态数据,如邮件存储、日志、图片文件、存储当贝等类型的数据。Swift是一个可扩展、存多份的分布式存储系统,没有主控节点,可扩展到PB级另1J0主要有consistency server、storage server和proxy server组成。一致性服务和存储服务部署在同一个存储节点上,所有的认证都使用keystone验证和授权。其架构部署图如图1所示。
3 proxy负载均衡
Swift各个组件之间的通信主要有代理服务器负责。有关swift的所有服务都需要通过proxy,它提供了符合HTTP协议的对外API接口,外部只需要访问该API接口就可以完成输入输出等操作。由于proxy起着主要的通信作用,因此负载均衡的主要任务就在它身上,需要对proxy加入负载均衡才能保证系统的稳定性,否则集群存储系统也无法充分的发挥各自的作用。随着互联网的兴起,对网络带宽和数据存储处理能力提出了更加严格的要求,普通的单一服务器无法满足其需求,而超级计算机又太贵,因此,集群服务器成了一种趋势。有很多的创业公司都无法承担这种复杂的任务或者费用,多数租借阿里云、新浪云、百度云或者腾讯云作为自己的云存储服务器。而这些阿里云、腾讯云由于其自身企业的需要,也需要众多的服务器资源,因此建立商业化的、高性能的云存储服务对外提供服务的同时,也能作为自己盈利的一个方向。
4 负载均衡的改进
负载均衡主要有两种策略可以实现,一种是通过调整对应的I/O策略,让集中的访问均匀的分布在各个存储服务器节点上,每个节点都会得到均匀的访问,从而能够更好的工作。另外一种是检测空闲的节点和负载过重的节点,一旦发现有负载过重的节点,就会立马把任务往空间的节点上分配,对于每一个节点的负载都会有一个队列去记录其负载量。从而合理的分配各个节点的负载。
常见的动态负载调度算法有轮叫调度、加权轮叫调度、最小连接调度、加权最小连接调度、基于局部性的最少连接调度、带复制的基于局部性最小连接调度。
4.1 WLC调度算法
综合考虑资源消耗和性能,在上述的六种动态调度算法中,效果最为理想的是加权最小连接调度算法,该算法根据各个存储服务节点的处理能力,赋予不同的权值,然后用这些权值来代表其存储和处理能力。在服务器节点权值设置中,对于不可用的服务器权值设置为1,管理员可根据每一个服务器性能的好坏对他们赋予不同的权值。每一个服务器的负载是通过当前服务器连接的活跃数量来决定的,活跃的连接数越多,代表该服务器的负载量越大,反之该服务器的负载量越小。加权最小连接调度算法的流程如下:
假设有一个服务器集群S={S1,S2,S3,S4,……,Sn},各个服务器Si的权值为W(Si),C(Si)表示当前服务器节点的活跃数量,也就是负载数量。所有节点的负载总数之和为
当有新的请求到达分配调度时,需要满足一定的判断条件:
该算法充分的考虑了每一个节点的处理能力,因此避免了因为节点处理能力的不同导致出现的虽然分配均衡,但任然出现严重的性能问题现象,进一步的均衡了每一个节点的负载。
4.2 改进的负载均衡算法
4.1中的WLC加权最小连接调度算法的负载效
文档评论(0)