多角度认识重复数据删除.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 1 PAGE 1 多角度认识重复数据删除 重复数据删除是推动基于磁盘的备份的一个技术动力。对于数据存储来说,重复数据删除是一个识别数据集中的冗余并消退这些冗余的过程。重复数据删除操作可能发生在这个流程中的许多个点,主要取决于厂商和详细状况。 重复数据删除是推动基于磁盘的备份的一个技术动力。对于数据存储来说,重复数据删除是一个识别数据集中的冗余并消退这些冗余的过程。重复数据删除操作可能发生在这个流程中的许多个点,主要取决于厂商和详细状况。例如,在备份中,重复数据删除可能发生在数据发送到备份服务器(有时成为“源”)或者备份设备接收数据副本(称为“目标”)的时候。在针对灾难恢复的复制中,重复数据删除可能发生在数据发送到灾难恢复站点以避免不必要的带宽消耗时。不少行业专家都供应了关于在何处实施重复数据删除是最抱负的选择,但是现在我们先把这些都放在一边,把重点放在重复数据删除是什么这个问题上。这事了解重复数据删除的价值和适用对象的第一步。 不管在哪里实施,重复数据删除解决方案的步骤都是类似的。接收到的数据被分割成文件或者更小的子集,有些状况下这些是固定的,有些系统是可变的。这些数据子集经过一种供应了特别标识符的哈希算法进行处理,可以被看作是一个“标记”或者序号。然后把这种特别的标识符与其他从之前保存过的数据所生成的标识符进行对比。当冗余数据被删除掉的时候,重复数据删除就生效了。例如,假如当重复数据删除发生在接收数据而不是找到标识符的时候,接收到的数据就不会被保存,而是创建一个指向现有数据的连接。假如标识符查找任务添加到查找表格的过程中找到了标识符,那么数据就会被保存下来。假如重复数据删除发生在单独的后处理流程中,那么会首先保存冗余数据,然后在后处理流程中删除掉。 虽然重复数据删除流程中有许多小的变量,但这就是它的运作方式。识别冗余的颗粒度以及查看流程的速度是特别重要的,也是不同厂商产品的一个关键区分。 例如,文件层级的重复数据删除不要求太多软件方面的操作,也不会有识别文件中冗余片段之后的数据删除操作。假如连续两天将相同的数据库拷贝到一台重复数据删除设备上的话,那么文件级重复数据删除设备将会看到两份单独的文件。相同状况下,一个片段层级的重复数据删除设备中会看到一样的文件,假如发生变更就只保存变更数据,同时创建一个指向冗余数据的指针。 这种指针就像是一个关联数据库不会拷贝每个发票中的用户信息,而是创建一个指针,从一个独立的表格中调用用户的信息。重复数据删除系统实际上就是把文件中的片段当作一个关联数据库。 重复数据删除的用户 显而易见,要使用重复数据删除就必需有冗余的数据。唯恐数据中心中没有哪个存储库的冗余数据要比备份存储更多的了。大多数数据中心每周或者每月会进行一次全面备份,而且这些备份中大多数数据都是与上一次全面备份的数据是相同的。这就是重复数据删除主要针对的领域,也是这个市场为什么成为重复数据删除技术应用第一个落脚点的原因。 随着重复数据删除渐渐在市场中普及,人们也开始对在备份流程中使用SATA磁盘越来越感兴趣。问题是,尽管新的SATA技术的成本要比光纤通道低许多,但是不会比磁带更低。假如使用磁盘,那么它的主要功能就是作为临时保存副本、然后将数据发送到磁盘的缓存。 这个策略令人绝望的一点是,尽管磁盘备份可以缩短备份窗口时间,但是其他一些瓶颈会减弱使用磁盘的效果,例如网络速度和备份客户生成数据流的能力。 磁盘备份的优势在恢复方面表现得更加明显一些。使用磁盘,你不需要挨个地搜寻磁带查找数据,你可以直接定位到数据的保存位置。这就避免了恢复流程中速度最慢的一部分:找到数据。 在磁盘备份方面,重复数据删除取得了重大的改进。它让数据更有效更具成本效益地保存在磁盘上。正如之前所提到的,大多数全面备份都是高度冗余的。甚至是日常的备份也会产生大量冗余。例如,一个备份应用每天会把一个数据库或者Exchange库视作是全新的。上面说了,重复数据删除设备只保存变量。这样即使是每天备份,效率也不会受到影响。 总体影响是,重复数据删除允许在磁盘存储上保存数月的备份,这只比全面备份的实际容量大一点。因此,使用磁盘就是很有成本效益的方法,备份也可以保存在磁盘而不是磁带上。 重复数据删除的第二个影响就是可以电子保存数据。在基于标准磁盘的备份中,整个备份可以作为一系列新的大型的文件保存起来。这样不仅识别这些文件中的变更数据,而且复制到传统WAN中又过于浩大了。然而,因为重复数据删除之保存变更的数据块或者数据片段,因此它可以轻松地将这些变更复制到一个远程灾难恢复站点。重复数据删除的最大好处可能更多是关于灾难恢复而不

文档评论(0)

185****8664 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档