数据挖掘应用到云计算环境的有效性分析.docVIP

数据挖掘应用到云计算环境的有效性分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘应用到云计算环境的有效性分析.doc

数据挖掘应用到云计算环境的有效性分析   摘 要 云计算在当前的计算机技术发展中是热度很高的话题,对于它的具体定义描述,到目前还没有一个较为权威统一的标准。从它的结构构成来讲,它是一种新兴的共享基础架构和方法,它的开展基础是公开的标准和服务,围绕互联网为中心来提供相关服务,它在当前社会的大多数领域都有了广泛的应用和体现,涉及到诸多的领域,需要在具体应用时进行综合全面的把握,基于此,本文就在分析云计算开放环境和系统的关键研发基础上,对云计算模式下的数据挖掘平台原型建立进行了分析,阐述了平台在实际应用中的扩展性和通用性,可以给相关领域的研究学者提供参考作用。   【关键词】云计算 数据挖掘 应用 有效性   随着社会发展的不断进步,对于数据挖掘系统的建立和研发工作也取得了一定的成效,虽然国内外研究学者已经研发出了多种形式的数据挖掘系统,但是都或多或少的存在着一些缺陷和不足,像价格成本高、复杂繁琐等。在新形势下,随着云计算模式的出现,它为大量数据的分析提供了一种快捷低价的应对方案,使数据挖掘平台的建立有了可行性的趋势,云计算从实质上来说,它是一种在计算机网络结构下的超级计算模式,具有存储能力强、计算能力可弹性明显等的特点,可以有效的实现大量数据挖掘的工作。   1 云计算的综述   云计算的实质是一种计算服务,它是由计算资源和软件以及其他各种信息资源共同构成的,它可以在网络技术的支持下,脱离空间的限制,使用计算机或者是其他相关设备等来进行终端的访问。云计算中的“云”是一个并行和分布式的系统,它的构成是由互相牵连的虚拟计算机实现的,可以实现被动的部署,最后作为一个或多个统一计算资源来体现,它的服务形式是基于服务运营商和用户两者之间进行协商的服务等级协议,并在这个协议下提供服务。此外,从另一层面来说,它还是一个弹性空间很大的资源执行环境,关系到诸多的利益方,并对其提供可以进行计量的服务,笔者所讲的云属于是基础平台,可以以多种形式在不同的资源上进行执行。   2 数据挖掘技术   当前形势下数据挖掘技术已经得到了实际应用,主要涉及到关联规则、分类、聚类以及预测和序列模式。   2.1 关联规则   它分为两个类型,一是Apriori算法;二是频繁模式增长算法。那么任何一种模式的发现都是在同一个交易数据库中的特定项目和其他项目之间的关系基础上。   2.2 分类   它是一种利用数学方法来完成的技术,包括线性规划、神经网络等。在进行分类的过程中在软件作用下可以掌握数据项分组的方法。   2.3 聚类   聚类技术也对类和类中的对象进行了阐述,在这种技术下,相同类型的数据可以规划到一起,并有明确的标注,便于查找应用。   2.4 预测   预测主要用于发现自变量之间及其和因变量之间的关系,那么实际案例中,可以把销售额作为自变量,利润为因变量,进而预测到未来的销售利润。   2.5 序列模式   它是一种在事件发生的时间顺序上相关的数据挖掘技术,发现的模式主要用于各种不同数据之间关系的深层化分析研究。例如2010年,Kawuu W.Lin等所提出的多任务频繁模式挖掘的策略。   3 云计算环境下的数据挖掘优势分析   在云计算环境下来进行数据的挖掘工作,这在当前形势发展下是具有重要作用的,这与云计算环境的特性是由很大关系的,那么在云计算环境下来分析数据挖掘工作的优势就可以从下三方面来阐述:   (1)一般来说,数据挖掘是大量的,规模较大,需要从大量的数据中挖掘出理解的知识,这在互联网数据不断增长的形势下,对于其的挖掘任务远远超出了搜索任务,有很大的复杂性,这就导致了在进行挖掘的过程中,要具备良好的开发环境和应用环境,那么这种挖掘要求就需要充分的应用到云计算环境。   (2)在云计算环境下,可以顺利的实现低成本分布式并行计算环境,基于此,就可以大大降低企业的数据处理成本,而且也摆脱了对高性能机器的依赖性。   (3)在云计算环境下,进行数据开挖活动时十分的便利,对底层有屏蔽作用。而且在并行化条件下,云计算还可以在原有设备的利用基础上进一步的提高对大规模数据的处理能力和速度,这样不仅确保了容错性,而且还起到了增加结点的作用。   4 云计算环境下数据挖掘平台的分析   4.1 账户管理子系统   账户管理的子系统一般是针对于管理用户对与平台相关的服务状况,进行的一个账户收支明细的详细记载,这个系统是平台的基础所在。从它的构成结构来看,它主要涉及到四个方面的功能,即支出的明细、收入的明细、账户余额以及历史记录。这四个方面是相互作用,相互联系的,其中每一部分的作用是有区别的,支出明细主要是对用户所使用的平台中的付费服务和设施的明细账目进行详细合理的记录;收入的明细主要涉及到它的两项主要来源,一是

文档评论(0)

lmother_lt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档