- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
为重复数据删除设备优化备份映像-IBM
为重复数据删除设备优化备份映
像
英文原文:
/2012/03/optimizing-backup-images-for-data-deduplication-devices/
充分利用 DB2 9.7 的重复数据删除设备支持
作者:Roger Sanders |
发表日期:2012 年 3 月 1 日
重复数据删除能够最大程度地减少存储需求、加速备份和恢复、降低网络流量,从而显著改
善数据库环境。
但在发布 DB2 v9.7 FixPack 3 之前,如果需要为重复数据删除设备优化 DB2 备份映像,
则必须合理地设置多个 BACKUP DATABASE 命令选项。否则,备份目标的重复数据删除设
备很可能无法使用您生成的数据流来识别冗余的数据“块”。为了简化将 DB2 数据库备份
到重复数据删除设备的过程(同时提高删除备份映像中重复数据的效率),IBM 在 DB2 v9.7
FixPack 3 中为 BACKUP DATABASE 命令引入了 DEDUP_DEVICE 选项,并在 FixPack 4
中改进了该选项的行为。在这篇专栏文章中,我将介绍重复数据删除是什么,以及重复数据
删除的常见实现方法。此外,我还会介绍如何执行 DB2 备份操作,包括如何在指定了
BACKUP DATABASE 命令的 DEDUP_DEVICE 选项时执行此操作,以及如何在未指定此选
项时执行该操作。最后,我会提供一些建议:如果您使用 DB2 v9.7 FixPack 4 以外的版本,
应该如何为重复数据删除设备优化 DB2 备份映像。
重复数据删除是什么?它是如何实现的?
重复数据删除(有时也称为“智能压缩”或者“单实例存储”)是一种特殊的数据压缩形式,
旨在消除冗余数据。与其他压缩形式类似,重复数据删除的工作方式是检查数据,识别具有
等同字节模式的部分。如果发现此类模式,则会仅将数据的单独一个惟一实例写入存储;将
出现的重复实例替换为“数据指针”,引用之前存储的版本。考虑到相同的字节模式可能会
出现数十次、数百次乃至数千次,使用重复数据删除设备之后,需要物理存储的数据量可能
会大幅减少。
例如,假设一个电子邮件系统包含某个 4 MB 附件的 100 个完全相同的实例。如果在未使
用重复数据删除的情况下备份这个电子邮件系统,保存该附件的全部 100 个实例,那么需
要 400 MB 的存储空间。然而,如果将相同的电子邮件系统备份到重复数据删除设备,那
么实际上仅储存了附件的一个实例,后续出现的每个实例仅引用已保存的副本。这样,备份
该系统所需的 400 MB 存储空间就会缩减为 4 MB !
如前所述,大多数重复数据删除设备的工作方式都是对比相对较大的数据“块”,例如整个
文件或者文件中较大的部分。设备会为所检查的每个块指派一个标识符,这个标识符通常使
用加密散列函数计算得出。很多实现都假设:如果标识符等同,则对应的数据也等同。其他
一些实现摒弃了这种假设,而是执行逐个字节的对比,验证标识符相同的数据是否确实相同。
无论如何,如果确定某个特定的数据块在删除了重复数据的命名空间内已经存在,就会使用
一个指向已存储数据的链接取代该数据块。随后,在访问删除了重复数据的数据时,如果遇
到链接,就会将该链接替换为它所指向的数据。当然,整个过程对于最终用户和应用程序都
是透明的。
通常情况下,重复数据删除通过两种方法之一执行:“内联”或 “后处理”。使用内联重复
数据删除时,会在将数据写入磁盘之前执行散列计算和查找。这样,内联重复数据删除能够
显著减少所需的原始磁盘容量,因为任何未经过重复数据删除处理的数据均不会写入磁盘。
出于这方面的原因,内联重复数据删除往往被视为最有效、最经济的重复数据删除方法。尽
管某些内联重复数据删除解决方案供应商已经能实现与后处理重复数据删除水平相当的性
能,但由于内联重复数据删除需要耗费时间来执行散列计算和查找,因此会减缓某些操作的
速度。
对于后处理重复数据删除,所有数据会在重复数据删除过程开始之前写入磁盘。这种方法的
优势在于,无需在存储数据之前等待散列计算和查找完成。缺点在于,必须暂时将重复数据
写入存储,因此需要的初始存储量更多一些。这种方法也会延长完成重复数据删除的延迟时
间。
传统 DB2 备份操作的工作方式
为了理解 BACKUP DATABASE 命令的 DEDUP_DEVICE 选项如何为重复数据删除设备优
化 DB2 备份映像,最好先了解一下发起备份操作时,数据通常会得
原创力文档


文档评论(0)