- 36
- 0
- 约2.64千字
- 约 2页
- 2021-03-06 发布于福建
- 举报
文件级和块级重复数据删除技术的优缺 点
2008年 12 月 12 日 11:23 IT168.com
作者 :TechTarget 中国
重复数据删除技术大大提升了基于磁盘的数据保护策略、 基于 WAN 的远程
分公司备份整 合策略、以及灾难恢复策略的价值主张。 这种技术能识别重复数据 ,
消除冗余 ,减少需转移 和存储的数据的总体容量。
一些重复数据删除技术在文件级别上运行 ,另一些则更加深入地检查子文件或
数据块。 尽管结果存在差异 , 但判断文件或块是否唯一都能带来好处。 两者的差异
在于减少的数据容 量不同 ,判断重复数据所需的时间不同。
文件级重复数据删除技术
文件级重复数据删除技术通常也称为单实例存储 (SIS ,根据索引检查需要备份
或归 档的文件的属性 ,并与已存储的文件进行比较。如果没有相同文件 ,就将其存储 ,
并更新索 引;否则 ,仅存入指针 ,指向已存在的文件。因此 ,同一文件只保存了一个实
例 ,随后的副 本都以 “存根 ”替代 ,而 “存根 ”指向原始文件。
块级重复数据删除技术
块级重复数据删除技术在子文件的级别上运行。 正如其名所示 , 文件通常被分
割成几部 分—— 条带或块 ,并将这些部分与之前存储的信息予以比较 ,检查是否存在
冗余。
最常见的检查重复数据的方法是 :为数据块指定标识符 , 例如 , 利用散列算法产
生唯一 的 ID 或 “足迹 ”,标识数据块。然后 ,将产生的 ID 与集中索引对比。如果 ID
已经存在 , 就说明以前曾处理并存储该数据块。因此 ,只需存入指针 ,指向之前存储的
数据。如果 ID 不存在 ,就说明数据块独一无二。此时 ,将 ID 添加到索引中 ,将数据块
存储到磁盘中。
每个供应商检查的数据块大小各不相同。 一些供应商固定数据块的大小 , 一些
则使用不 同大小的块 ( 有一些甚至允许终端用户改变固定块的大小 ,这会令人更加
困惑。 固定块的 大小可能为 8 KB 或 64 KB, 区别在于块越小 ,被判定为冗余的几率
越大。这也就意味着消 除的冗余更多 , 存储的数据更少。固定块只存在一个问题 :
如果文件发生变化 ,而重复数据 删除产品依然利用上次检查到的固定块 , 那就可能无
法监测冗余部分 , 因为文件中的数据块 已被改变或移除 ,而利用的固定块仍是变化之
前的 ,剩下的比较就没有意义了。
各种规模的块能够提高普通冗余的监测几率 , 尤其是在文件发生变化以后。 这
种方法能 够监测文件中可能发生的实样模或断点 , 从而分割数据。 即使文件变化 ,
数据块被转移 ,这 种方法也能发现重复的数据。 不足之处呢 ?这种方法能改变块大
小 , 需要供应商追踪并比较 多个 ID , 因此会影响增大规模、增加计算时间。
文件级技术和块级技术不仅在运行上存在差异。两种方法各有优缺点。
文件级删除技术的效率不如块级技术的情形 :
文件内部发生变化 ,就会导致整个文件需要重新存储。
您可能关注的文档
最近下载
- 现代物流装备与技术课件.pptx VIP
- 2025年辽宁师范高等专科学校单招职业技能考试题库(考点梳理).docx VIP
- (车辆工程)新能源汽车试题及答案.doc VIP
- 西师大版小学数学3年级下册全册教学课件.pptx
- 人教版八年级数学上册第二单元测试卷+答案.doc VIP
- 1.1.3建筑施工组织说课.pptx VIP
- 青光眼讲课ppt.ppt VIP
- 浙商文化与大学生创新创业01了解浙商概况.pptx VIP
- 湖南科技职业学院22026年单独招生考试职业技能测试大纲及样题(专业组一B、D类考生).pdf VIP
- 辽宁省沈阳五校协作体2025-2026学年上学期高三1月期末物理试卷(含解析).pdf VIP
原创力文档

文档评论(0)