- 1、本文档共83页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分布式非事务列式存储引擎的设计与实现-计算机系统结构专业论文
摘要
摘要
I
I
摘 要
近年来随着网络技术的不断发展,接入网络的方式不断优化,越来越多的用 户数据出现在互联网上。面对这种井喷式出现的数据,当前业界的大部分数据分 析系统都还是传统的基于磁盘的模式,虽然很多系统已经在分布式方面做了极大 的改进,但这种架构本质上存在着计算速度慢、CPU 资源利用率低、导入效率低 下等问题。
针对这些问题,本文结合当前国内外的研究现状和发展态势,分析现有数据 仓库系统的架构及特点,再根据自身项目的具体需求,设计并实现了内存数据存 储引擎(Memory Database Engine, MDE),它能为企业部署一个海量数据的高 速处理平台,提供一个实时响应、高可靠、高伸缩性的分布式数据仓库系统,可 以更好的支撑上层的各种分析方法。使得企业能从繁杂冗余的数据中极快的得到 清洗过的数据,尽早的应对变化多端的市场。本文主要工作与创新点有以下几 点:
1.设计了内存数据存储引擎的系统架构。它基于列式存储的模型架构,数据 按列存储能够更好的支持数据压缩,并且在查询时的效率更胜行式;同时,采用 双机热备、高可用集群等机制保证了高可靠性。
2.设计了能够高效压缩和快速增量的数据结构来存储数据仓库的数据,在节 约内存资源的同时,提高了计算效率。
3.网络 IO 选型采用 epoll 异步事件驱动模型,配合内存操作,效率数量级的提 升。磁盘 IO 方面,将利用线程池模型处理异步操作,增加系统的并发处理能力。 4.系统提供大部分数据库物理计划执行的接口,给上层提供处理过后的数
据,减少网络传输和解析调度节点的资源浪费。
5.动态分配任务,中控节点实时掌握各节点的状态信息,新的请求将根据负 载状态被分配到合适的节点存储和计算。同时系统会进行自动的负载均衡,负载 过大的节点在满足条件后将会自动迁移一部分数据到另一个轻负载节点上去。
通过功能和压力测试,结果表明本系统能够对海量数据进行有效的存储和读 取,能够极大的缩短计算响应时间,能够实现系统的负载均衡,满足内存存储引 擎设计的初衷。
关键词:分布式系统、负载均衡、内存数据仓库、列式存储
AB
ABSTRACT
II
II
ABSTRACT
In recent years, with the development of network technology, the way of access the Internet has been improved with the time, which causes more and more user data online. In the face of this blow out data, most data analyse systems are still disk based mode, although many company have made great improvement in distributing the system, but this kind of architecture remain huge problems of our future analyzation, speed of query and import is slow, the low utilization rate of resources etc..
Aiming at these problems, this thesis looks up to many researches and combines the development trend of the industry, analyzes the existing data warehouse system’s architecture with their features, and finally designs and implements the memory based storage engine (Memory Database Engine, MDE) with our own specific needs. This system can deploy a high speed platform of mass data processing for the enterprise, to provide a real time response, high reliability, high scalability’s distributed data warehouse system, all for a better supporting to the upper layer’s analysis method. So that
您可能关注的文档
- 分布式制造网络组织模型构建研究管理科学与工程专业论文.docx
- 分布式制造网络组织模型构建研究-管理科学与工程专业论文.docx
- 分布式动力高速动车组的预测控制与动态仿真-控制理论与控制工程专业论文.docx
- 分布式动态运行维护系统设计与实现-软件工程专业论文.docx
- 分布式协同地理建模任务接口的图形化定制研究-地图学与地理信息系统专业论文.docx
- 分布式匿名通讯关键技术研究-信息安全专业论文.docx
- 分布式协调控制系统的故障诊断与容错性分析-控制科学与工程专业论文.docx
- 分布式协同工作环境中人-信息系统可信交互研究-机械工程(工业工程)专业论文.docx
- 分布式卫星双向非相干星间精密测量算法研究-控制理论与控制工程专业论文.docx
- 分布式单相光伏并网发电关键技术研究-电气工程专业论文.docx
- 完整版汽车维修技能大赛理论知识考试题库及答案内部题库精品有答案.docx
- 完整版汽车维修技师试卷及答案内部题库通用.docx
- 完整版汽车维修技能大赛理论知识考试题库及答案内部题库精品(精选题).docx
- 完整版汽车维修技师试卷及答案完整题库及答案【名师系列】.docx
- 完整版汽车维修技师试卷及答案优选题库带答案(考试直接用).docx
- 完整版汽车维修技能大赛理论知识考试题库及答案王牌题库及一套答案.docx
- 完整版汽车维修技师试卷及答案优选题库(基础题).docx
- 完整版汽车维修技能大赛理论知识考试题库及答案真题附答案【综合卷】.docx
- 完整版汽车维修技师试卷及答案题库附参考答案(基础题).docx
- 2025年高中化学必修部分的重难点知识汇总必备.doc
文档评论(0)