- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计 算 机 系 统 应 用 2013 年 第 22 卷 第 1 期
基于云存储的重复数据删除架构的研究与设计①
宋 雨, 易 璐, 王凤霞
(华北电力大学 控制与计算机工程学院, 保定 071003)
摘 要: 随着云计算的发展, 云存储技术通过集群应用、虚拟化技术、分布式文件系统等功能将网络中大量各种
不同类型的存储设备集合起来协同工作, 缓解了老式数据中心的存储压力. 另外, 重复数据删除技术是一种缩减
存储空间减少网络传输量的技术, 随着云的广泛应用也势必会发展应用于云存储中. 这两种技术结合将会给 IT
存储业带来实际效益. 本文通过研究重复数据删除技术、云存储技术, 设计了基于云存储的重复数据删除架构,
提出了一种用 In-line 方式在客户端进行数据块级与字节级相结合的重复数据删除操作后再将数据存入云中的方
案. 在本架构下, 海量数据存储在 HDFS 中; 而文件数据块的哈希值存储在 HBase 中.
关键词: 重复数据删除技术; 云存储; hash 值; HDFS; HBase
Research and Design of Data De-duplication Architecture Based on Cloud Storage
SONG Yu, YI Lu, WANG Feng-Xia
(School of Control and Computer Engineering, North China Electric Power University, Baoding 071003, China)
Abstract: With the development of cloud computing, the cloud storage technology gets a large variety of different types
of network storage devices together to work collaboratively by clustering applications, virtualization, Distributed File
System, alleviating the pressure of old data center storage. Besides, Data De-duplication is a technology that reduces
storage space and lowers the network transmission. And it is going to be adaptable for cloud storage system one day. The
combination of these two technologies will bring real benefits to IT storage industry. The paper has designed a
de-duplication architecture based on cloud storage, proposed a scheme which runs at the client with In-line manner to
eliminate duplicated data in chunk level, and then put those data into cloud. Under this architecture, HDFS stores the
mass data while HBase stores hash value of data block.
Key words: data de-duplication technology; cloud storage; hash value; HDFS; HBase
随着各行各业信息化的要求越来越高, 需要存储 种技术的优势发挥得淋漓尽致, 既能将海量数据存储
的数据量越来越庞大, 然而, 已经存储的数据中有相 在
您可能关注的文档
最近下载
- 《混凝土结构加固设计规范》GB50367.pdf VIP
- 《精神疾病诊断与统计手册》DSM5.PDF VIP
- 2冷疗技术15课件讲解.pptx VIP
- 海姆立克急救法操作考核标准.doc VIP
- JJG 195-2019 连续累计自动衡器(皮带秤).pdf VIP
- 专项治理整改落实及长效机制建设情况报告().pdf VIP
- TD∕T 1087-2023 主体功能区优化完善技术指南.pdf
- (完整word版)数独题目100题(可打印).doc VIP
- 0604-会计专业国家技能人才培养工学一体化课程标准(试用).docx VIP
- 04.汉杂事秘辛.一卷.汉.阙名撰.明崇祯时期汲古阁刊本.pdf VIP
文档评论(0)