高级数据库结课论文解说.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
题目: 基于HBase的数据存储与管理研究 PAGE  目 录  TOC \o 1-3 \h \z \u  HYPERLINK \l _Toc403567783 摘要  PAGEREF _Toc403567783 \h 1  HYPERLINK \l _Toc403567784 一、概述  PAGEREF _Toc403567784 \h 1  HYPERLINK \l _Toc403567785 二、研究背景  PAGEREF _Toc403567785 \h 1  HYPERLINK \l _Toc403567786 三、HBase分布式数据库  PAGEREF _Toc403567786 \h 2  HYPERLINK \l _Toc403567787 1、HBase与Hadoop及其组件的关系  PAGEREF _Toc403567787 \h 2  HYPERLINK \l _Toc403567788 2、HBase系统架构  PAGEREF _Toc403567788 \h 3  HYPERLINK \l _Toc403567789 3、HBase存储结构  PAGEREF _Toc403567789 \h 5  HYPERLINK \l _Toc403567790 4、HBase数据模型  PAGEREF _Toc403567790 \h 9  HYPERLINK \l _Toc403567791 四、总结与建议  PAGEREF _Toc403567791 \h 12  HYPERLINK \l _Toc403567792 五、主要参考文献  PAGEREF _Toc403567792 \h 12  《高级数据库技术》课程报告  PAGE 13 摘要 在如今数据急剧膨胀的时代云计算应运而生,它为海量数据的存储和处理提供了一种新的解决方案,Hadoop作为Apache开源组织的一个分布式计算框架在很多商业应用中得到实践,它可以使用户在不了解分布式系统底层细节的情况下,开发分布式程序对大数据进行处理。Hbase数据库是基于Hadoop 的Apache 顶层项目,它是BigTable 的开源实现,是一个面向列的非结构化数据库。 本文首先介绍了Hadoop的子项目HDFS和MapReduce的作用以及对HBase数据的支持性,然后依次阐述了Hbase的主从式系统架构和Region集群中存储架构,介绍了StoreFile的compact和splite过程,详细分析了HLog、HFile和 KeyValue存储格式的结构。在此基础之上分析了HBase表的逻辑模型及面向列的物理存储模型,总结HBase中表的特点。本文还提出了HBase在社交网站数据、电子商务数据和RDF数据存储和管理方面的三个应用领域。最后提出HBase数据库存在的问题和解决策略。 关键词:HBase,数据库,存储结构, 数据模型 Abstract Cloud computing comes into being with the data explosion.It provides a new?solution?for storaging and processing?mass data.? As a open source distributed?computing framework of? Apache ?Hadoop has been proved to be available?in many business applications.?it can be used?in?distributed system in the case that users?do not need to understand?the underlying details.Users develope?the distributed?program to process the?large data.?The Hbase database is?Apache top-level?project based on Hadoop,?it?is an?open source implementation of BigTable oriented to columns non-structural database. First part of this paper introduces the sub project of HDFS an MapReduce Hadoop?and how they support the H

文档评论(0)

w5544434 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档