大数据在裸机上的表现更好-IBM.PDF

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
白皮书 大数据在裸机上的 表现更好 让大数据性能成为优先事项 执行摘要 如今,企业创建并从多种来源收集数量空前的结构化数据和非结构化数据。存储、处理这种“大数据” 从中提取价值并非易事。IT 专业人员常常配置公共云服务器来扩展存储和处理能力,以适应这种源源 不断的数据流,但这些虚拟化资源无法提供相等裸机服务器所具备的性能和一致性。 IBM Cloud 在虚拟服务器和裸机服务器上测试了大数据工作负载的性能和一致性,以比较两款平台 对于用于存储和处理海量数据的应用的适用性。利用这些结果,在为存储密集型和处理器密集型工 作负载选择云资源时,IT 专业人员可以做出更好的决定。 大数据在裸机上的表现更好 02 什么是大数据? 随着存储技术的发展以及更大容量变得越来越经济实惠,企业发现了收集和处理更多数据的新方 法。从这种信息中,公司发现具有潜在商业价值的洞察。而挑战在于,如何组织和分析数据以制定 新业务战略并作出组织决策。 直到最近,最普遍的数据组织和分析工具仍是采用结构化查询语言 (SQL) 的关系数据库管理系统 (RDBMS)。SQL 解决方案使用通常在单台服务器上存储和操作的结构化数据集。当数据集的大小 触及现有服务器容量上限时,该解决方案会进行纵向扩展,转向处理性能更强、存储和 RAM 容量 更多的更大服务器。这种纵向扩展可能耗费大量时间,并导致成本大幅增加。 当数据从众多来源、在无数架构中更快涌入时,数据库管理员需要最大限度提升他们解决方案的 效率和可扩展性。结果,许多人开始利用 NoSQL (Not Only SQL) 数据库,该数据库使用非关系型 和非结构化数据集。“大数据”架构让数据能够在多个系统中存储,支持 NoSQL 应用通过逐步增 添商品系统进行横向扩展,从而实现随需应变的容量增长和更高的成本效益。 © 2017 IBM Corporation 大数据在裸机上的表现更好 03 这些大数据架构可以理解海量数据,但要做到这一点, 数据提出了重大的基础架构要求: • 适合海量数据的存储 • 按需移动和加载数据的 RAM • 与解决方案所需性能水平相称的处理能力 • 能够以低延迟连接分布式数据存储以增强性能的网络 为了满足这些要求,许多企业将云计算资源用作底层基础架构,以横向扩展他们的大数据环境。 在这些环境中,最常见的构建模块是虚拟化公共云服务器和裸机服务器。 大数据的四个 V 规模 (Volume) :想象 PB 级规模。 速度 (Velocity) :数据在不断产生, 从网络历史记录,到公共云,再到私有内部文 利用实时查询按需获取有意义的信息。 档,企业存储各种信息。 价值 (Value) :从大数据获取的有意 种类 (Variety) :大量的结构化数 义洞察,超越了传统智能查询和报告的结果。 据和非结构化数据,包括电子邮件、社交媒 这些洞察可以转变成预测性分析,以获取趋势 体、视频、图像、天气数据、博客等等。 和模式。 © 2017 IBM Corporation 大数据在裸机上的表现更好 04 裸机服务器与虚拟服务器 将裸机服务器和虚拟服务器当作同一工具箱中的两款工具加以考虑。一款工具并不天生比另 一款工具好;每款工具都有它自己的优势和劣势。 裸机服务器向客户提供服务器上原始硬件资源的直接、专有的访问。虚拟服务器是独立的云实 例,由可能是公共的(共享)或私有的硬件节点上的虚拟机管理程序配置。 裸机服务器 – 原始马力 对于处理器密集型和磁盘 I/O 密集型工作负载,裸机服务器(有时称作专用服务器)是理想选

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档