网站大量收购独家精品文档,联系QQ:2885784924

一种基于云计算数据挖掘平台架构的设计与实现.docVIP

一种基于云计算数据挖掘平台架构的设计与实现.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于云计算数据挖掘平台架构的设计与实现.doc

一种基于云计算数据挖掘平台架构的设计与实现   【 摘 要 】 随着网络技术的飞速发展,不仅给人们生产和生活提供更多有价值的信息,而且又能提升人类从大量数据中发现有价值信息的能力。现阶段,数据挖掘技术已广泛应用在各行各业当中,并且已取得了较好成果。本文主要针对基于云计算的数据挖掘平台架构设计与实现进行了深入探究和分析。   【 关键词 】 云计算;数据挖掘;平台架构;设计和实现;探究   1 引言   近年来,随着科学技术的飞速发展,大量的数据被存储到计算机等存储介质当中。通常情况下,所存储的数据多是复杂的、数据量较大的等。因此,难以通过人工而直接获得。尤其是在科研或是商业发展领域中,需要对海量的数据进行分析,从而找出更多有价值的信息。为解决上述问题,很多研究人员聚集在一起,研究出一种新型的数据挖掘技术。   近来,由于计算机技术、云计算技术的飞速发展,大量的数据都存储到了网络当中,而这些海量的、复杂式的数据信息给数据挖掘系统的实现带来很多的难题,如数据相对复杂,现有的计算能力难以达到技术要求,而可以借助云计算数据挖掘技术可提升处理复杂数据的能力。   2 云计算数据挖掘系统架构设计的分析   2.1 目标系统模型   在云计算环境下,构建目标系统为各种终端用户提供高透明化的界面服务,并且在此基础上也提供了开放式的接口支持。这样一来,用户不仅能够通过终端访问用户访问来使用系统,也或是利用其它应用程序调用开放式接口间接式的应用系统服务。不管遇到上述哪一种情形,用户都无需对系统实现而担心其存储能力,只需考虑要选择何种算法进行处理,最后通过任务形式部署给系统获得所需的挖掘结果。除此之外,云计算环境下的数据挖据平台中得模块都是利用用户界面和开放式接口提供服务的。其中,由开放式接口提供的服务均为外部可见服务。而当涉及到高级权限使用功能时,可通过用户界面直接调用开放式接口服务功能。   2.2 功能层次框架设计   2.2.1算法层   该层主要是利用下一层所提供的统一数据源来调用相关算法及对接口进行合理的管理。由于不同算法的执行顺序和得到的结果有所不同而分开的。例如数据清洗算法服务,它是针对具有噪声数据的数据及在应用数据挖掘算法前需要进行接口服务调用,把清洗后的数据利用数据层再储存到云计算平台中,为后续数据挖掘工作提供更好的服务;数据挖掘调用服务,在应用该服务之前,将已清洗的及不需要清洗的数据利用数据挖掘技术统一对数据进行调用。   2.2.2应用层   和其它层相比,该层的抽象性较强,它是把海量数据挖掘涉及到的数据、算法等之间的内在关系描述成任务,同时提供提供应用调用服务和维护接口等。   2.2.3用户层   该层主要为用户提供身份验证和授权等功能。   2.3 设计关键点   2.3.1插件系统设计   插件是结合相应的应用程序开发接口规范而实现的一种程序。其中,任何一个插件都是由三大部分构成的,即扩展点、业务逻辑、调用下层扩展点,并且这三者都是由相同的负责模块管理帮顶包跟各种服务所构成的。另外,每个绑定包涉及到一个服务说明接口与多个服务调用接口两种类型的接口。要求绑定包接口必须满足相关规范要求,若把插件防止到平台的某个特定目录下,能够识别和加载该动态。除此之外,算法实现不同于以往针对特定个数、排列数据而实现。它是在满足实现算法的基础上,利用抽象数据提供更多的兼容性。尽管这种算法实现存在很大的难度,但其算法的复用性有了显著提升。   2.3.2开放接口设计   通常情况下,开放接口主要被应用数据挖掘平台的开发使用。利用上述接口,开发者能够更好地利用数据挖掘平台提供的资源及数据服务。为实现开放接口高效性、直观性的目的,其平台接口主要应用的是表述性状态转移接口,英文缩写为:REST。该类接口的优势在于为无态型。也就是说,在同一个局域网中,浏览器中的缓冲装置可替代服务的重复调用。这样一来,不仅能够有效减轻服务器的运行负担,而且若用户量过多造成底层服务影响整个系统的运行,而此时可利用横向服务器数量的增加扩展线性的吞吐量。因此,利用云计算平台,能够为用户提供无穷大的数据吞吐能力,满足系统的性能要求。   3 云计算数据挖掘平台架构的实现   3.1 开发环境   Google的云计算开发环境主要为App Engine。当遇到重载或是数据量非常的情形时,也能轻松构建安全的应用程序。这是因为此环境的优势在于可提供动态服务、自动扩展等。   3.2 开发思想和技术   3.2.1原型开发模型   首先,需进行快速分析。在相关人员和用户的共同合作下,可准确确定出系统的需求,再结合原型的特征描述需求,来满足开发原型的需求。其次,原型的建构。在经过分析的基础上,结合需求快速建构一可行性较高的系

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档