- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浪潮云海大数据一体机解决方案
高端服务器研发部
高端容错计算机产品部
2013.1
目录
TOC \o 1-3 \h \z \u 一. 产品简介 4
1.1 浪潮云海大数据一体机总体架构 4
1.2 系列化产品 4
二. 关键模块介绍 5
2.1 Hadoop分布式文件系统: 5
2.2 Hadoop MapReduce计算框架: 6
2.3 HBase 分布式数据库 6
2.4 Hive数据仓库 7
三. 浪潮云海大数据一体机解决方案优势 7
3.1 高性能 7
3.2 高可靠性 8
3.3 高性价比 9
3.4 易管理 10
3.5 专业化服务 11
四. 竞争性分析 11
4.1 跟传统关系型数据库对比分析 11
4.2 跟开源Hadoop对比分析 13
五. 成功案例 14
5.1 某城市智能交通系统 14
5.2 某省级运营商清帐单查询系统 18
六. 浪潮云海大数据一体机配置 19
产品简介
为应对大数据时代的到来,浪潮集团适时推出浪潮云海大数据一体机,重点面向行业大数据应用,是一体化数据处理的解决方案。采用新型技术体系架构,整合软硬件系统,涵盖数据存储、数据处理、数据呈现等全环节。浪潮云海大数据一体机是公安、金融、电信、交通、医疗、企业等各个行业用户的大数据解决方案理想之选。
浪潮云海大数据一体机总体架构
系列化产品
SDA-1:
满配:CPU:480Core;内存:12TB;存储容量: 144TB;网络:1Gbps、10Gbps或者40Gbps
支持线性扩展
适合数据处理应用:模式计算,商业智能,医疗数据挖掘等。计算能力、I/O能力、存储能力均衡。
SDA-2:
满配: CPU:288Core;内存:6912GB;存储容量: 540TB;网络: 1Gbps、 10Gbps或者40Gbps
支持线性扩展
适合处理密集型的重载应用: 视频处理,图片处理分析,图像渲染,在线交易等。可重构加速器件或众核处理器,硬件加速。
关键模块介绍
HDFS分布式存储解决数据如何存储的问题,Map/Reduce解决数据如何处理问题,HBase解决实时数据库问题,Hive解决基于SQL的数据分析和挖掘。
Hadoop分布式文件系统:
–使用低成本存储和服务器构建
–存放PB级别的海量数据
–高可扩展性,实际生产环境扩展至4000个节点
–高可靠性和容错性,数据自动复制 ,可自我修复
–高带宽,高并发访问
Hadoop MapReduce计算框架:
为离线数据分析而设计,基本上是个利用数据并行性进行分布运算而后汇总结果的计算框架。通用的计算框架,松耦合,非常利于线性扩展。与HDFS一起使用,具有容错特性,数据本地化处理,通过移动计算,而非移动数据来实现高效数据处理。
?分析问题能够被并行化,且输入数据集可以被切分
?一个Map函数,在第一阶段计算Key,Value对
?一个Reduce函数,在第二阶段用于汇总Map函数的结果
HBase 分布式数据库
HBase是一个分布式的、按列存储的、多维表结构的实时数据库, 为高速在线数据服务而设计
–NoSQL
?面向列、可压缩,有效降低磁盘I/O,提高利用率。
?多维表,四个维度,其中三个维度可变,适合描述复杂嵌套关系。
?灵活的表结构,可动态改变和增加(包括行、列和时间戳)。
?支持单行的ACID事务处理
–分布式系统
?高性能,支持高速并发写入和高并发查询;
?可扩展,数据自动切分和分布,可动态扩容,无需停机;
?高可用性,建立在HDFS分布式文件系统之上。
Hive数据仓库
Hive是一个建立在hadoop之上的数据仓库,用于查询和分析结构化海量数据
–采用HDFS进行数据存储
–采用Map/Reduce进行数据操作
基本特点:
–提供类似于SQL的查询语言
–高扩展性(scale-out),动态扩容无须停机
–针对海量数据的高性能查询和分析系统
–提供灵活的扩展性
?复杂数据类型,扩展函数和脚本等
浪潮云海大数据一体机解决方案优势
高性能
专用的大数据存储服务器:针对大数据的应用特点,浪潮凭借在服务器及存储方面的领先优势,自主开发了大数据存储服务器,具备高密度、大容量存储特性。
胖节点加速方案:胖节点拥有英特尔至强平台的最强性能、最大内存、最高RAS特性保障。
闪存加速技术:将闪存盘放在整个计算缓存里面做高速缓存,针对不同应用类型,实现全局的算法,降低冗余率,使整个平台的计算节点、存储节点大大提高运行效率。
高速通信网络:通信网络选用性能领先的万兆网络或者IB网络,实现一体机内部的高速互联,消除网络瓶颈。
您可能关注的文档
最近下载
- 支票打印模板.xls VIP
- 疫情监测人员值班和调休工作制度.docx VIP
- 自动喷水灭火系统联动试验记录.docx VIP
- ISO 9001(DIS)-2026《质量管理体系要求》主要变化分析及其对策和建议清单(雷泽佳编制-2025年9月).pdf VIP
- 学院报告厅装饰装修施工组织设计方案.doc VIP
- ISO 9001(DIS)-2026与ISO 9001-2015《质量管理体系要求》主要变化对比说明(雷泽佳编制-2025年9月).pdf VIP
- 城市“灰空间”--机动车高架桥下部空间改造利用研究.pdf VIP
- 2025年政府采购评审专家考试题(带完整答案).docx VIP
- 计算污泥产量教学文稿.xls VIP
- 实验二、用Excel-Solver解供应链问题.doc VIP
原创力文档


文档评论(0)