- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 要 随着天文观测设备和技术的进步,天文观测数据规模的迅速增长使得如何存
储海量观测数据以及如何能够迅速从中获取想要的信息成为难题。传统单节点的
文件系统和关系型数据库在处理海量天文数据方面的性能无法让人接受。因此,
设计一套针对海量天文数据处理的分布式存储引擎便显得十分的必要和重要。 天文数据可以分为星表数据和星图数据,这两种数据有不同的格式和应用场
景。本文针对天文星表和星图的特点,分别设计了两种分布式存储方案,进而加
快对这两种数据的存取。星图数据采用分布式文件系统来存取,本文基于星图数
据的特点首先提出了混合数据访问模型以减轻分布式文件系统中的网络开销,然
后在开源分布式文件系统 OrangeFS 上实现了该模型。星表数据则采用基于位图
索引的列式存储引擎 FastBit ,本文针对单节点版本的 FastBit 在处理海量天文数
据时会遇到的内存问题,设计并实现了 FastBit 的分布式数据存储引擎,提出了
FastBit 的分布式数据划分算法以及基于 SQL 分析的并行查询算法。 本文主要分为两部分,第一部分首先分析了分布式文件系统中客户端节点在
不同文件大小与不同数据规模下的吞吐率瓶颈,并根据天文星图的特征提出了混
合数据访问模型。从模型的意义和目的角度,对其进行了分析和介绍。接着描述
了模型的原理和流程,以及如何将该模型应用到实际的 OrangeFS 分布式文件系
统中。通过 benchmark 以及真实天文应用的测试,验证了采用该模型的分布式存
储对天文星图读写的加速效果。 第二部分首先分析传统关系型数据库在处理海量天文星表数据时所存在的
问题,并介绍了基于位图索引的列式存储引擎 FastBit 以及它在处理海量天文数
据时所存在的内存问题。然后提出了 FastBit 的分布式数据划分算法以及基于
SQL 分析的并行查询算法,描述了 FastBit 分布式存储的整体架构,最后通过天
文星表数据进行实验验证,并对实验结果进行了性能分析。
关键词: 海量天文数据,分布式存储,位图索引,OrangeFS ,FastBit ,数据
布局 ABSTRACT With the development of the astronomical observation, the astronomical data is
increasing rapidly which makes the storage and search of the data become a big
problem. The performance of the traditional single-node file systems and relational
databases in handing massive astronomical data is unacceptable. Therefore it is
crucial and necessary to develop a distributed storage engines for massive
astronomical data. Astronomical data can be divided into star category and star image, both of which
have different data formats and application scenarios. This paper designs two
distributed storage solutions based on the features of the star category and star image,
thereby accelerating the access of these two data. Distributed file system is used to
access the star image. Based on the features of the star image, this paper first propose
the hybrid data access model to reduce the distributed file system, and then implement
this model on the open source distributed file sys
您可能关注的文档
最近下载
- 《红星照耀中国》7—12章分章分节练习及答案.doc VIP
- 离婚协议书范文下载(可打印直接用).docx VIP
- 离婚协议书下载(可打印直接用).docx VIP
- 新高考语文主观题的考题类型与解题技巧.doc VIP
- 部编版小学语文六年级上册第四单元教材分析集体备课单元主讲稿(新版).pptx
- T_CSAE 88-2018_小型电化学储能电站消防安全技术要求.pdf VIP
- 企业工会助推企业高质量发展.docx VIP
- 北师大版一年级上册数学 第二单元 5以内数加与减大单元教学分析(表格式).docx
- 项目管理课程-项目经理.ppt VIP
- 2025入团考试应知应会知识题库(附答案).pdf VIP
文档评论(0)