logo

您所在位置网站首页 > 海量文档  > 计算机 > 数据库

常见的数据仓库产品优缺点分析.ppt 23页

本文档一共被下载: ,您可全文免费在线阅读后下载本文档。

  • 支付并下载
  • 收藏该文档
  • 百度一下本文档
  • 修改文档简介
全屏预览

下载提示

1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
特别说明: 下载前务必先预览,自己验证一下是不是你要下载的文档。
  • 内容提供方 天鹅般的鸭子(上传创作收益人)
  • 发布时间:2018-11-07
  • 需要金币300(10金币=人民币1元)
  • 浏览人气
  • 下载次数
  • 收藏次数
  • 文件大小:544.06 KB
下载过该文档的会员
常见的数据仓库产品优缺点分析
你可能关注的文档:
数据仓库产品优缺点分析 简介 本文主要对目前国内市场上几种主流的数据仓库数据库产品,通过网络资料以及个人经验做一个简单的分析,从中可以较客观地得出各数据仓库产品的优势和不足,以及未来技术发展方向,为企业的数据仓库选型提供参考。 类别 一:Teradata数据库 Teradata天睿公司,专注大数据分析、数据仓库和整合营销管理解决方案的供应商。 二:GreenPlum数据库 Greenplum是一家为全球大型企业用户提供新型企业级数据仓库(EDW)企业级数据云(EDC)和商务智能(BI)提供解决方案和咨询服务的公司。 三:Netezza数据库 IBM(国际商业机器公司)2010年9月收购的专门的数据仓库数据库,为使大数据高级分析更简单、更迅捷和更易用而设计。 四:Exadata数据库 Oracle的新一代数据库云服务器。 第一种: Teradata数据库 Teradata近几年一直处于数据仓库领导者地位,Teradata数据仓库产品线丰富,能够适应各种规模的数据仓库。产品主要是集成的专用数据库设备(集成了服务器、存储、操作系统和数据库)。Teradata的数据仓库解决方案齐全,以前一直走“高端策略”,在大规模企业级数据仓库客户中占有绝对优势。不过,在其他产品的竞争下,逐渐向中端客户领域扩展。 第一种: teradata数据库系列 单节点系列(面向开发和测试)。 1系列(面向大规模数据存储分析)。 2系列(面向部门级数据仓库) 4系列(采用固态硬盘,面向高速分析) 5系列(面向企业级数据仓库) 第一种:teradata架构 第一种:Teradata优势 大数据量处理性能较强。 可线性扩展,实现投资保护。 数据库易于管理和维护。 第三方软件产品丰富。 有一套完整的ETL方案、配置灵活 采集异构数据时,数据会落地成.txt文件,并保留一定的天数,方便查错。 通过perl采集数据时,向teradata插入数据时速度快,只受限于网络和链接接口。 第一种:Teradata不足 专用设备,环境搭建复杂,扩展时停机时间较长 混合负载控制存在问题 各系列产品互联困难 价格较高 etl过程和td的工具绑定紧密,对数据库本身的性能依赖强 etl环境搭建复杂、非图形化 自定义函数过程复杂,需要用c编写并导入 数据库在做线性扩展时,数据需要重分布,消耗资源大,时间长 第二种: GreenPlum GreenPlum2010年被EMC收购后,产品线进一步完善,提供独立的数据库软件和集成的数据仓库设备两种解决方案。将SQL和MapReduce功能整合到统一的数据处理框架中,利用MPP架构的并行计算能力满足大规模数据存储和处理需求。产品的一大特色是可与任何基于MapReduce的外部产品协同工作,容易实现当下流行的“云计算”架构;另一大特色是用户可以自行选择开放平台PC服务器搭建海量数据处理环境,降低数据仓库的TCO。 第二种:GreenPlum架构 第二种:GP无共享架构的特点 最易于扩展的架构 内部处理自动化并行,无需人工分区或优化 数据分布在所有的并行节点上、每个节点只处理其中一部分数据 最优化的I/O处理、所有的节点同时进行并行处理、节点之间完全无共享,无I/O冲突 增加节点实现线性扩展、增加存储、查询和加载性能 第二种:GreenPlum优势 支持行列混合存储,消除了单独行存储和列存储的缺陷 在线扩容和维护,无需停机 数据加载速度快,可实现实时分析 基于PosgreSQL开发,语法简单,工具和应用资源丰富 符合“云计算”发展方向 第二种:GreenPlum不足 使用开放平台实现,稳定性相对较差 大数据量在节点间重分布时,其非专用网络设计易导致性能瓶颈 开发客户端功能不完善,功能灵活性不足。 函数运算性能不足,在过程中动态sql比静态sql运行效率高,使得开发、迁移、测试更复杂。 创建表空间和文件空间不方便。 对其他操作系统支持差。 第三种:Netezza数据库 IBM最初使用DB2提出数据仓库解决方案,并提供独立数据库软件和数据库机的解决方案,但产品技术优势不明显,且未给予足够重视,市场逐渐萎缩。为弥补不足,2010年IBM收购了专业的数据仓库厂商Netezza,希望利用Netezza的技术来与Teradata、Oracle等产品抗衡。Netezza提供集成的数据库设备Twinfin解决方案,利用专利“流式数据处理架构FPGAs”技术(硬件芯片),在数据通过磁盘时可以将无关数据快速过滤,解决了传统数据仓库产品的服务器和存储间数 据流瓶颈问题,实现高性能数据处理。 第三课:IBM Netezza 架构

发表评论

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名: 验证码: 点击我更换图片

“原创力文档”前称为“文档投稿赚钱网”,本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】。原创力文档是网络服务平台方,若您的权利被侵害,侵权客服QQ:3005833200 电话:19940600175 欢迎举报,上传者QQ群:784321556