浪潮云海大数据解决方案v30.docxVIP

下载本文档

1
0
约7.21千字
约 20页
2019-09-14 发布于上海
举报
版权申诉

浪潮云海大数据解决方案v30.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

浪潮云海大数据一体机解决方案高端服务器研发部高端容错计算机产品部 2013.1 目录 TOC \o 1-3 \h \z \u 一．产品简介 4 1.1 浪潮云海大数据一体机总体架构 4 1.2 系列化产品 4 二．关键模块介绍 5 2.1 Hadoop分布式文件系统： 5 2.2 Hadoop MapReduce计算框架： 6 2.3 HBase 分布式数据库 6 2.4 Hive数据仓库 7 三．浪潮云海大数据一体机解决方案优势 7 3.1 高性能 7 3.2 高可靠性 8 3.3 高性价比 9 3.4 易管理 10 3.5 专业化服务 11 四．竞争性分析 11 4.1 跟传统关系型数据库对比分析 11 4.2 跟开源Hadoop对比分析 13 五．成功案例 14 5.1 某城市智能交通系统 14 5.2 某省级运营商清帐单查询系统 18 六．浪潮云海大数据一体机配置 19 产品简介为应对大数据时代的到来，浪潮集团适时推出浪潮云海大数据一体机，重点面向行业大数据应用，是一体化数据处理的解决方案。采用新型技术体系架构，整合软硬件系统，涵盖数据存储、数据处理、数据呈现等全环节。浪潮云海大数据一体机是公安、金融、电信、交通、医疗、企业等各个行业用户的大数据解决方案理想之选。浪潮云海大数据一体机总体架构系列化产品 SDA-1：满配：CPU：480Core；内存：12TB；存储容量： 144TB；网络：1Gbps、10Gbps或者40Gbps 支持线性扩展适合数据处理应用：模式计算，商业智能，医疗数据挖掘等。计算能力、I/O能力、存储能力均衡。 SDA-2：满配： CPU：288Core；内存：6912GB；存储容量： 540TB；网络: 1Gbps、 10Gbps或者40Gbps 支持线性扩展适合处理密集型的重载应用: 视频处理，图片处理分析，图像渲染，在线交易等。可重构加速器件或众核处理器，硬件加速。关键模块介绍 HDFS分布式存储解决数据如何存储的问题，Map/Reduce解决数据如何处理问题，HBase解决实时数据库问题，Hive解决基于SQL的数据分析和挖掘。 Hadoop分布式文件系统： –使用低成本存储和服务器构建 –存放PB级别的海量数据 –高可扩展性，实际生产环境扩展至4000个节点 –高可靠性和容错性，数据自动复制，可自我修复 –高带宽，高并发访问 Hadoop MapReduce计算框架：为离线数据分析而设计，基本上是个利用数据并行性进行分布运算而后汇总结果的计算框架。通用的计算框架，松耦合，非常利于线性扩展。与HDFS一起使用，具有容错特性，数据本地化处理，通过移动计算，而非移动数据来实现高效数据处理。 ?分析问题能够被并行化，且输入数据集可以被切分 ?一个Map函数，在第一阶段计算Key,Value对 ?一个Reduce函数，在第二阶段用于汇总Map函数的结果 HBase 分布式数据库 HBase是一个分布式的、按列存储的、多维表结构的实时数据库, 为高速在线数据服务而设计 –NoSQL ?面向列、可压缩，有效降低磁盘I/O，提高利用率。 ?多维表，四个维度，其中三个维度可变，适合描述复杂嵌套关系。 ?灵活的表结构，可动态改变和增加（包括行、列和时间戳）。 ?支持单行的ACID事务处理 –分布式系统 ?高性能，支持高速并发写入和高并发查询； ?可扩展，数据自动切分和分布，可动态扩容，无需停机； ?高可用性，建立在HDFS分布式文件系统之上。 Hive数据仓库 Hive是一个建立在hadoop之上的数据仓库，用于查询和分析结构化海量数据 –采用HDFS进行数据存储 –采用Map/Reduce进行数据操作基本特点: –提供类似于SQL的查询语言 –高扩展性(scale-out)，动态扩容无须停机 –针对海量数据的高性能查询和分析系统 –提供灵活的扩展性 ?复杂数据类型，扩展函数和脚本等浪潮云海大数据一体机解决方案优势高性能专用的大数据存储服务器：针对大数据的应用特点，浪潮凭借在服务器及存储方面的领先优势，自主开发了大数据存储服务器，具备高密度、大容量存储特性。胖节点加速方案：胖节点拥有英特尔至强平台的最强性能、最大内存、最高RAS特性保障。闪存加速技术：将闪存盘放在整个计算缓存里面做高速缓存，针对不同应用类型，实现全局的算法，降低冗余率，使整个平台的计算节点、存储节点大大提高运行效率。高速通信网络：通信网络选用性能领先的万兆网络或者IB网络，实现一体机内部的高速互联，消除网络瓶颈。