- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
内存计算技术:大数据应用引擎.doc
内存计算技术:大数据应用引擎 在大数据时代,内存计算技术将会有着十分广阔的应用空间和前景。 作为中国最大的瓶装水生产商,农夫山泉股份有限公司(简称农夫山泉)的IT应用系统中,每天都要产生大量的数据。在认识到这些数据的巨大潜在价值后,农夫山泉想要对这些海量数据进行分析,来为企业的运营和业务等提供决策支持。但由于数据量太大,农夫山泉股份有限公司在对这些数据进行分析时,遇到了一些挑战。例如,农夫山泉每次结账前都需要做运费对账,运费计算涉及的层面非常广,里面的逻辑计算十分复杂。系统通常需要24小时来运行这个运费报表,有时候甚至生成不了这张报表。这样的速度导致农夫山泉每个月财务结算都要推迟一天。 不过,在实施了SAP HANA系统后,现在这张运费报表只需要37秒就可以生成,和之前相比,运算速度提高了2335倍。 传统数据库技术的瓶颈 这一堪称奇迹的进步背后,正是内存计算技术发挥了至关重要的作用。顾名思义,内存计算技术,实质上就是CPU直接从内存而非硬盘上读取数据,并对数据进行计算、分析。“这项技术是对传统数据处理方式的一种加速,是实现商务智能中海量数据分析和实施数据分析的关键应用技术。”SAP公司全球数据库解决方案亚太区技术总监卢东明说道。 事实上,作为数据库领域一项创新的技术,内存计算的出现,对于数据库市场带来了巨大的冲击。在卢东明看来,过去20年,数据库技术的发展其实陷入了瓶颈之中。由于少数数据库厂商对市场的绝对垄断,导致它们疏于数据库技术方面的创新。 但在处理传统的在线交易处理(OLTP)应用时,这种创新瓶颈的问题并没有得到完全的体现。因为,OLTP系统主要是对发生的业务进行实时记录,处理的主要是大量简单、小规模、同时发生的交易。因此,对于数据挖掘和分析的需求并不是很大。 但随着大数据的出现,企业对于在线分析处理(OLAP)应用的需求越来越强烈,也就是说,企业对于海量数据的挖掘和分析越来越重视,而且,更为关键的是:他们需要实时的分析和挖掘。 在这种情况下,传统数据库技术的瓶颈被放大:由于传统的数据库技术是将数据存储在硬盘上,需要进行计算和分析时,再将数据从硬盘调用到内存中。在处理海量数据时,这种方式无疑会耗费大量的时间,很难做到实时计算。 速度成为最大优势 而内存计算技术,则是将需要分析的数据全部存储在内存之中,并在内存中进行大量的数据分析和计算。这样,对于海量数据的分析速度将得到大大的提升。 举一个例子:如果过去装修一个房子,需要到现场去测量,然后回去准备所需的材料打造成家具。HANA的理念是无需再移动数据。也就是说,可以就地取材,就在数据所在位置开始测量、开始建造。 显然,这样的优势是更灵活、反应更快。因此,内存计算非常适合处理海量的数据,以及需要实时获得结果的数据。比如可以将一个企业近十年几乎所有的财务、营销、市场等各方面的数据一次性地保存在内存里,并在此基础上进行数据的分析。当企业需要做快速的账务分析,或要对市场进行分析时,内存计算就能够快速的按照需求完成。 通过上述的分析,不难看到内存计算技术的最大优势:速度。这一点,对于大数据应用显然十分关键。比如,在银行业,大数据可以应用与信用卡防盗、防欺诈等方面。但如果数据的分析处理时间需要一两天甚至一周,那么对于银行而言,显然已经没有什么意义。他们需要的是系统能够对数据进行实时的处理和分析,为银行的相关工作人员提供实时的告警。 “内存计算技术在大数据时代将会有十分广阔的应用空间。采用内存计算技术,企业的海量数据处理能力将会得到几倍甚至几十倍的提高,也就意味着企业业务响应速度的大幅提升,这种提升所带来的价值是显而易见的。”卢东明分析道。“因为,在很多行业,如果一直能够比竞争对手快一点,那无疑就会在市场上取得明显的竞争优势。” 此外,内存计算还可以模拟一些数据分析的结果,实现对市场未来发展的预测。例如,可以帮助用户在事情没发生前假设各种场景,然后进行分析,以预测将要发生的事情。 SAP的HANA是内存计算技术应用的典型代表。通过采用内存计算技术,HANA在大数据领域表现抢眼。 文章开头提到的农夫山泉,是SAP内存计算技术在中国的第一个客户,在应用HANA之后,农夫山泉所有的销售数据都加载在HANA中,进行分析和计算,而且,其分析和计算在几秒钟内就可以完成。“在它原来的平台之上,不可能把所有的历史数据完全加载计算。如果非要计算也可以,但分析的周期可能是以年为单位。”卢东明说。在卢东明看来,随着大数据应用的普及,内存计算技术的应用空间将会越来越广泛,甚至有可能改变数据库市场的“游戏规则。” 当然,内存计算技术也并非完美。例如,在内存增大的情况下,散热问题如何处理?此外,目前大部分病毒都是针对内存展开攻击,如果未来内存计算技术大量普及,那么信息安全又该如何保证? 不过,随着内存计算技术的发
原创力文档


文档评论(0)