《coudybi宣传彩页.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《coudybi宣传彩页

基于云计算技术的海量数据解决方案——CloudyBI 海量数据的挑战 复杂查询耗时过长,甚至无法完成 系统面对大并发时,性能急剧下降 传统数据库可扩展性差,增加硬件无法有效提高性能 海量数据的存储和处理,需要昂贵的投资及维护费用 怎么办? Teradata?——太贵了! Hadoop?NOSQL?——好像这个解决关系数据库的复杂查询问题也不是,再说会用这些技术的人也很贵啊! ??? CloudyBI——基于云计算技术解决海量数据挑战! CloudyBI产品特点: 快:独特的并行BI架构,革命性的提升查询速度! 云计算的核心在于数据的分布式存储与大规模并行计算,google,yahoo,百度,facebook等互联网巨头正是利用这一技术来处理它们后台的海量数据,从而获得巨大商业利益。CloudyBI将这一技术与传统的关系数据库技术相结合,创造出独特的基于云计算技术的BI系统,为基于关系数据库的海量数据处理带来巨大的突破。 海量数据处理速度对比 传统数据仓库与BI解决方案 CloudyBI解决方案 稳定可靠:智能节点替换技术,系统性能稳定可靠。 在节点坏掉的时候,可以自动用备份节点替换掉故障节点,保证系统的稳定性。互联网等巨头使用的hadoop分布式系统,通常对一份数据保存3次,每份数据都放在不同的服务器上,当某个服务器宕机后,系统仍然能通过其他备份节点访问数据。CloudyBI采用和hadoop类似的多重备份模式,一份数据,多重备份(CloudyBI可以由系统管理员指定采用几重备份)。当有节点宕机后,系统自动用备份节点替换掉故障节点,保证系统稳定运行。 并发能力:多项负载均衡技术,轻松应对海量数据大并发访问。 通过dispather指定任意节点承担Master任务,有效消除并行计算中master节点工作负荷太重的问题;通过内容索引,二次查询等技术,有效减少按条件查询时对全节点进行扫描,运算的系统资源浪费等问题。在多节点配置下,可以轻松应对上千并发。 可扩展性:核心架构可线性扩展,成倍提升系统性能 由于系统是完全基于并行的模式设计,因此,当节点增加时,整个系统的I/O,CPU,内存等呈线性增长,因此,系统性能也能成比例提高。 零客户端:完全BS架构设计,部署使用方便快捷 整个系统完全按照云计算的架构,从系统管理,报表和查询的开发,用户使用完全基于Web完成。所有操作界面都通过浏览器完成,用户可以使用私有云在企业内部部署,也可以使用公有云的模式,将数据上传到云BI中心,让后通过云的方式使用,分析数据。 CloudyBI产品技术架构 总体架构 传统的数据仓库是集中在一台大型服务器上的,CloudyBI则是将数据分割到相互联系的一个集群上。每个服务器上有一小部分数据,整个集群的数据组合成一个完整的数据集。当系统并行运算时,整个系统的I/O,CPU,内存都远远高于单服务器的架构,从而为数据处理速度带来巨大的提升。 和云计算的map/reduce/merge架构相对应,可以将数据分割理解为map,将每台服务器单独处理的模块理解为reduce,最后在汇总节点进行再处理则理解为Merge。 并行数据分割技术 在并行计算系统中,如何分割数据是整个并行计算的核心问题之一。 简单按字段做hash分割,可以快速分割数据,但是对系统带宽有很高的要求,而且系统的并发,可扩展性都有很大限制。(某些国外的系统,超过20个节点就要是用万兆网络,且不可以并发) 按业务规则进行复杂的数据分割可以极大的减少节点间数据的交换,降低并行计算系统对带宽的要求。但同时又会带来一个新的问题,就是分割数据的运算量非常巨大(当对一个1.3亿条的数据按业务规则进行分割时,单服务器进行的分割时间需要20多个小时)。 为了有效解决这个两难的问题,CloudyBI开发了并行数据分割系统,用多机并行的模式按业务规则对数据进行有效分割(对1.3亿条数据,9台机器进行分割,可在24分钟内按成)。 容错技术 系统采用多重备份模式,一份数据,多机存储。当某个节点出现故障时,系统的节点替换模块会自动更新节点信息,用备份节点替换掉故障节点。用户在前台操作时,丝毫体会不到系统在后台的操作。对于云计算系统来说,容错技术是系统保持稳定的技术基础。 负载均衡技术 云计算技术面临的一个技术挑战就是要应对大并发的访问。 在并行计算时,所有子节点的运算结果,需要由某个汇总节点进行集中再处理。在大并发的条件下,如果这个汇总节点是固定的,那么它的任务负荷一定会非常重,将会造成整个系统的崩溃。 CloudyBI采用Mas

文档评论(0)

lisufan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档