分布式文件系统数据块聚类存储节能的策略.docVIP

下载本文档

5
0
约1.05万字
约 17页
2018-10-13 发布于福建
举报
版权申诉

分布式文件系统数据块聚类存储节能的策略.doc

1、本文档共17页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

分布式文件系统数据块聚类存储节能的策略

分布式文件系统数据块聚类存储节能的策略　　摘要：针对分布式文件系统中由于数据块随机放置而导致的服务器利用率低、能耗管理复杂的问题，建立了数据块访问特征向量模型描述用户对数据块的随机访问，运用Kmeans算法对数据块进行聚类计算，根据计算结果将数据节点划分为多个区域以存储不同聚类簇的数据块，在系统负载较低时进行数据块动态重配置，关闭不必要节点达到节能的目的。为使得策略适用于对能耗和资源利用率有不同要求的场景，算法中聚类簇间隔参数可灵活设置。实验通过和冷热区划分算法进行比较表明：按照聚类结果进行数据块重配置后，能耗节省效率优于冷热区划分算法，节省能耗35%～38%。　　关键词：云计算；分布式文件系统；数据聚类；动态重配置；节能计算　　中图分类号： TP393.09 文献标志码：A 　　Abstract： Concerning the low server utilization and complicated energy management caused by block random placement strategy in distributed file systems， the vector of the visiting feature on data block was built to depict the behavior of the random block accessing. Kmeans algorithm was adopted to do the clustering calculation according to the calculation result， then the datanodes were divided into multiple regions to store different cluster data blocks. The data blocks were dynamic reconfigured according to the clustering calculation results when the system load is low. The unnecessary datanodes could sleep to reduce the energy consumption. The flexible set of distance parameters between clusters made the strategy be suitable for different scenarios that has different requests for the energy consumption and utilization. Compared with hotcold zoning strategies， the mathematical analysis and experimental results prove that the proposed method has a higher energy saving efficiency， the energy consumption reduces by 35% to 38%. 　　Key words： cloud computing； distributed file system； data clustering； dynamic reconfiguration； energyefficient computing 　　0 引言　　伴随着数字时代的蓬勃发展，数据激增和信息爆炸现象的出现不可避免，云计算以其资源动态分配、按需服务的设计理念，通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的系统。借助软件服务（Software as a Service，SaaS）、平台服务（Platform as a Service，PaaS）、基础设置服务（Infrastructure as a Service，IaaS）等先进的模式把强大的计算能力分布到终端用户手中，可以低成本解决海量信息处理的问题[1]。传统的分布式文件系统通常用于高性能计算或大型数据中心，对硬件设施条件要求较高。Google文件系统（Google File System， GFS）[2]为Google云计算提供海量存储，采用廉价的商用机器构建分布式文件系统，同时将GFS的设计与Google应用的特点紧密结合，并简化其实现。Hadoop分布式文件系统（Hadoop Distributed File System， HDFS）[3]作为Java语言开发的开源分布式文件系统，其设计目标与GFS