- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 1
PAGE 1
关于归档的几个技术
存储专家JonToigo概括介绍了几种归档技术,以及保障它们顺当运行的技术,并解释了数据分类至关重要的原因。 你知道什么是FLAPE?假如不知道,你可能已经跟不上最新的归档技术发展。请看存储专家JonToigo对于归档以及如何避免无意将垃圾信息归档保存是怎么说的。 数据归档的想法——将其放置在一个安全节能,合理组织的信息库里,以备将来某一天的突然需要——听起来够直白了吧。然而即使是这样一个简洁的想法也是布满了问题,需要提前做好深思熟虑的。本文争论的一些决策可能会影响到你的归档项目的成败。 在大多数关于归档的争论中的一个典型问题就是,数据的组织方式和格式是否经得起时间的考验。假如数据归类的方式在以后需要发生转变,那怎么办——例如,对某些类型数据管控和保留的规则发生了变化。或者用于创建某种数据的应用程序不再被新的操作系统或硬件平台支持,比方说10年后?莫非在可预见的将来你都必需保留一份现有应用程序和处理器的副本吗?这些实际问题都需要简洁而有效的解决对策。 从数据归档方法的发展上思索这些问题的答案是有助益的。在过去,数据归类并放入存档是依据元数据(metadata),或数据的数据。一个数据集或文件,依据其元数据,假如在30、60、90天或更长时间内没有被访问到或修改,就会被简洁地迁移出生产系统的存储空间,转入归档存储。然而,这种方法没有任何粒度的区分。它完全不顾数据的重要性,与特定业务流程的相关性,或者与任何数据保留的法规法律的关联性。所以这个过程有可能保存下来的有可能是垃圾文件,互联网cookies和浏览器残余,甚至是很久以前测试、开发过程中创建的临时虚拟机的镜像文件。 最起码的一点是,除非你有一个“数据清洁”的程序到位,并帮助清除掉那些杂物,否则你的存档系统注定会像你的主存储系统一样,在经过一段时间后布满了各种垃圾。这使得将来在存档系统中搜寻和使用有用信息更具挑战。 对于无颗粒数据选择的一种可选方案是基于谁创建它来进行分类。假如甲乔在会计部门工作,从乔甲的工作站中出来的全部数据都可以被作为“会计类数据”,并经由为该类数据所制定的存档策略进行处理。然而,这种做法也为以后留下了麻烦,例如,当甲乔的职位发生变化,从会计部门到销售部门(对数据归档的策略完全不同),或者当甲乔喜欢上社交媒体,他在推特和博客中共享关于他的孩子和爱好的信息开始和他的合法工作文件一起存档。你不得不再次面对存档系统满是垃圾,数据搜寻使用很难的结果。 依据部门工作流程的数据分类 数据分类的最佳方式是把概念作为最大的粒度:按部门的工作流程创建数据分类,而不是按用户角色来分类数据。然后在元数据中设置像“数据上次访问时间”和“数据最终修改时间”这样的触发器,以确定何时将相关文件转移到存档系统。一些新兴的分层存储架构,如FLAPE(flashplustape,闪存加磁带),可以使你在把数据写入主存储系统(闪存,硬盘或两者的组合)的同时就把数据也保存到归档系统,这样,你无需以后再次把数据移到归档系统,而是保存在主存储系统中的文件在达到其归档点后会被简洁地删除。 作为一项规则,今日的归档管理员会尽量规避那些可能有“时限”的数据格式。文件系统看起来相当稳定,但是用于存储数据位的“容器”,要使得它们在离开了最初创建它们的原软件后,依旧能够被使用——例如,有些商业文件格式,如AdobePDF,或部分仍旧处于试验阶段的“标准”XML容器——这依旧是个问题。一家重要的国家档案馆几年前选择了AdobePDF作为他们的数据容器,却对此打算懊悔不迭。因为Adobe在他们打算后的两年就转变了PDF格式,他们为此不得不对每一个数据进行“解”摄取,重新格式化,然后重新摄取的工作,花费了比以前多出30多倍的时间和工作量。 另一个挑战则可能来自于早期对文件系统的稳定性和永久性的假设。实际上,文件系统也一直在转变,新的文件系统,被每一个今日流行的操作系统引入并利用,伴随着新的功能特性,例如作为存储方法一部分的重复数据删除和压缩,或作为数据保护方法的纠删编码。文件系统扁平化趋势随着网络的发展有可能预示着传统的分层或基于树的文件系统模型将会在较短的时间内被新的范式所取代,那时全部数据都以对象进行保存,在一个类数据库的结构中自描述或自索引。 对象存储的归档 新的商业技术,如CaringoSoftware的SWARM或SpectraLogic的BlackPearl,说明作为传统存储归档方法替代品的对象存储市场正在孕育出真正成熟的解决方案。尽管如此,截止本文写作之时市场上依旧没有
文档评论(0)