- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 1
PAGE 1
内存分析在大数据分析中的作用
本文重点介绍内存技术在大数据分析中扮演的角色,还有该技术转变商业智能结构和行业技术空间的潜力。 在《关于大数据》一文中,我争论了大数据的一些问题,以及利用大数据解决方案处理和管理,并从大容量数据中以不同形式和资源导出有价值的信息的必要性。在本文中,我将重点介绍内存技术在大数据分析中扮演的角色,还有该技术转变商业智能结构和行业技术空间的潜力。但首先要了解一些基本概念。 基本框架 拥有内存技术意味着什么?意味着全部在计算机中的数据都被存储在随机存取存储器(以下简称RAM)中,而不是硬盘中。内存数据的存储从以下方面得到了改善: 通过使用半导体存储媒介,而不是使用物理磁盘存储,数据读取和处理的速度更快 通过最小化或是避免机器读取和编写,各种运营的执行延迟时间将缩短 通过使用不同的和创新性的方式存储数据,处理大容量数据效率得到提高 硬件技术的发展已经在支持内存技术的发展和使用中起到了关键作用。例如,使用64位处理器,使服务器处理更大内存,并允许当前服务器架构和在RAM中的工作。可扩展器和并行处理器使内存技术能利用RAM改进的性能优势。 具有内存技术能力的产品在软件行业并非新技术。比如,QlikTech(它的产品QlikView被人们所熟知)早在90年月就开始研发基于内存的产品,还有其他诸如IBM这样的BI应用程序系统供应商,比如IBMCongo已经利用该技术有10多年的历史了。很多软件供应商用一种方式或其他方式供应内存能力,尤其是那些数据分析,比如BI软件供应商供应在线分析处理(OLAP)。将数据存储在RAM和OLAP的应用程序系统能够加速数据搜寻和分析处理,同样还可以通过应用创新性的方式管理和存储数据来简化数据建模。以下的表格排列了在OLAP服务中利用内存技术的软件产品。 许多产品已经利用内存技术来供应更快的数据分析和发掘服务。一些供应商的产品甚至供应内存数据引擎的实施服务(比如,QlikView,PowerPivot,Kognitio,Spotfire,Tableau)。这样的引擎使数据能够安排内存,比如使用柱状存储架构,以BI为目的,从而提高数据处理性能。 然而分析学和BI能充分利用内存数据库系统(IMDSs),IMDSs并不是出于这样的目的而被开发的。例如…这样的数据库系统是多用途内存中创建的数据库特殊允许运行的应用程序,以实现快速响应。这样的系统可能潜在地转变企业流程和区分交易性(业务)和非交易性(分析)数据。 从设计的角度而言,IMDSs展示了确保在严格环境中的最高性能表现的关键特点: 削减数据传输超载。利用传统数据库管理系统(DBMSs)需要从文档存放磁盘中读取数据,正如他们直指实际数据,IMDSs无需或只需一点数据传输。 削减或消退缓存。删除内存中的数据库缓存,确保几乎全部数据都保存在RAM中。 优化内存使用(压缩)。该功能允许IMDSs优化RAM中的数据存储和处理。 因此,内存数据库在增加数据处理性能方面已经证明白其优势。现在让我们一起来看看内存技术如何帮助解决大数据带来的挑战。 当内存与大数据不期而遇 内存技术如何适应于大数据的范围。容量、种类和数据增长时的处理速度,企业将需要收集更多的数据,并将数据分析作为决策流程的一部分。该信息同样也需要准时进行分析,赋予竞争优势。对于一些企业来说,要求数据的收集和分析并最终用于决策的时间特别短。处理大批量的结构性和非结构性数据的方法是部署大数据解决方案,比如基于Hadoop的数据解决方案,以管理大数据为目的。随着内存数据库技术的发展,使得高速分析实时的巨大而复杂的数据群成为可能。因此,之前需要花费数天或是数小时的分析现在可以利用IMDSs在几小时,几分钟,甚至几秒钟内完成。 内存技术的使用同样能促进点对点的性能和非正式数据分析,可能引起数据发掘和流程提高。因此,在部署大数据战略时,超级快速数据库或是内存数据库看似应当是合乎规律的伴侣。与大数据解决方案类似,内存数据库能供应以下功能: 存储。能够处理大量数据内存 简洁。用简洁的方式处理结构化与非结构化数据 流程速度。供应高速处理数据的能力。 从技术角度来说,在部署大数据解决方案时,企业需要考虑的基本特征,以及从内存数据库技术中获益的关键问题如下: 1.高速缓存和内存交换。应用系统如何处理数据量超出磁盘的可用空间状况。
您可能关注的文档
最近下载
- 第6课 欧洲的思想解放运动(新教材课件)-【中职专用】《世界历史》同步精品课堂(高教版2023•基础模块).pptx VIP
- 1000HP钻机总结.doc VIP
- 机械制图(第二版)全套PPT课件.pptx
- (2025秋新版)北师大版二年级数学上册《数学好玩 猜数游戏》PPT课件.pptx
- 江苏省连云港市东海县实验中学2024-2025学年九年级上学期第一次月考语文试题(含答案).pdf VIP
- Sharp夏普扫描仪DW-D20HZ-W DW-D20NZW3 CF-20HZW 3用户手册.pdf
- 2024-2025学年九年级语文上学期第一次月考试卷附答案解析.pdf VIP
- C站JUE-85中文操作说明书-07-9-10.pdf VIP
- 智能融合终端通用技术规范2025.docx
- 2024年中级经济师《经济基础》真题卷(1116下午).pdf VIP
文档评论(0)