海量异构数据存储平台及其优化方案综述.pdfVIP

  • 2
  • 0
  • 约1.34千字
  • 约 2页
  • 2026-02-01 发布于上海
  • 举报

海量异构数据存储平台及其优化方案综述.pdf

第一篇论文主要是提出一种针对异构云存储设施的高校的云存储模式。他在第二

部分说明了相关的一些研究,第三部分介绍他提出的模式,第四部分是总结。并

举出了云存储和传统存储之间的区别,说明了云存储的一些要求。

第二篇论文中首先介绍了目前云存储服务的现状,就是一些云提供商完全控制

了云存储中心的数据,用户通过付费来购买自己所需的资源。当前云服务的重点

是为客户提供简洁的界面和高性能服务(类似网盘什么的,我猜。。。)但是,有

些云存储模型当前的服务不能很好地满足。所以提出一个星云的概念,利用了先

进的网格,P2P系统和分布式数据中心。意思大概是利用零散的志愿者存储,把

数据分散到数万计的主机中。优点是:可伸缩,地理分散,低成本部署。这个在

异构存储设施中是可以实现的。

第三篇论文介绍了一种存储罐存储系统。它充分利用了存储区域网络的好处。存

储罐是一种强大的、全面的存储管理解决方案,继承了SAN技术的好处并且可以

解决各种客户的需求。它运行在异构环境,它允许数据共享在许多多样化的平台,在

服务器和客户端提供了大量的可伸缩性数据,确保高可用性客户数据,包括集中、

自动存储和数据管理,有助于降低存储管理成本。并且,存储罐提供的I/O处理

比得上本地文本系统,比NAS系统要好。存储罐存储系统在继续演变着。对于未

来,运行在这之上的NAS闸流器可以很好地利用它的可伸缩性和基于策略的存储

管理的好处;并且广域网络上的异构数据分享会变得有可能;并且他可以无缝的

整合到全自动存储系统中。

我发现第一篇和第三篇论文有一部分介绍云存储现状的是一模一样的,并且

2010年的文章,应该是最近现状的一个不错的总结,还算比较新。但是这些论

文都比较具体,我又搜到一些更加全面的关于易购数据存储方式的介绍,在下面

给出。希望这些资料对研究有帮助。

非结构化数据的存储方式有以下几种:

(1)直接存储在结构化数据库的BLOB字段中。以二进制的格式保存在结构

化数据库的BLOB字段中。保存在BLOB字段中的好处是调用文件的速度很

快,维护和管理简单,与其他应用系统没有任何关联;缺点一是由于非结构化数

据文件大,在数据量不断增大的情况下,会使得结构化数据库迅速膨胀,导致数

据库性能下降,进而影响整个应用系统的性能;二是由于各个应用系统相对封闭

和独立,其他应用无法共享相关文档资料。

(2)以FTP上传的方式保存到文件服务器中。以这种方式保存非结构化数据

的应用较少,比较典型的应用有数字档案馆、知识管理和网站。

(3)通过文件系统直接存储在文件服务器中。对于大多数没有应用系统的非结

构化数据,如信息管理部门常用的工具软件、开发的应用系统软件、源代码、开

发过程文档、技术研究资料等,新闻中心的素材、资料通常都是直接将文件存储

到文件服务器中。

其中,我找到一份中文的文档时说非结构化数据的云端存储的。MarkLogic公

司的MarkLogicSever是以文档为中心的数据库,专门针对半结构化和非结构

化数据进行设计和优化,能够实现TB级非结构化数据资源的全文检索。

文档评论(0)

1亿VIP精品文档

相关文档