- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Web Service技术分布式并行数据挖掘的研究与实现
摘 要:主要介绍基于Web Service技术的一个数据挖掘系统,在一个关联规则挖掘的并行算法―CD算法的基础上,结合一种基于动态数据集划分的并行关联规则挖掘算法,利用动态方式分配数据量,使每个处理器获得相同多的数据集,解决在网络中大量分散的数据因通信等问题而引起的负载平衡,从而提高了数据挖掘效率。??
关键词: Web服务;关联规则;并行数据挖据;动态数据集??
中图分类号:TP393 文献标识码:B
文章编号:1004-373X(2008)10-042-03?オ?
Reserch and Realization of Distributed and Parallel Data Mining Based on Web Service??
JIN Chunxia1,2??,BAI Qiuchan2??
(1.Southeast University,Nanjing,223001,China;2.HuaiyinInstituteofTechnology,Huaian,223001,China)?オ?
Abstract:The paper gives a distributed data mining system based on Web Services.On the basis ofCD algorithm,the paper presents a parallel algorithm for mining association rules based on dynamic dataset partition.By uning dynamic method to allocate data,a processor can obtain same dataset.Since it solves the load balance better because of the problems of distributed-data and communication,improves the efficiency of data mining.??
Keywords:Web service;association rules;parallel data mining;dynamic dataset??
1 引 言??
随着计算机在社会各领域的广泛深入应用,在测绘、商业、金融业等各领域中每天都在产生数量巨大的数据,Internet领域的迅猛发展也使得网络中的各种信息日益丰富。而这些数据又分布在不同地区。面对大量的GB级、TB级甚至更多的数据,如何处理数量日益增长的数据成为当今数字化社会面临的一个极具挑战性的问题。而随着网络系统的广泛应用,分布式数据挖掘日益受到关注,而分布式系统中存在着分布数据和异构性等问题,因此分布式数据挖掘不仅需要解决集中式数据挖掘中的算法时间复杂性问题,还要考虑数据的转换、站点扩展性以及通信代价等问题。本文针对并行关联规则挖掘算法不能有效的解决负载平衡,而导致挖掘效率低的问题,在CD算法的基础上,介绍一种基于动态数据集划分的并行关联规则挖掘算法,更好地实现负载平衡,从而提高并行数据挖掘的效率。??
2 Web Service简介??
2.1 Web Service技术??
Web Service技术是建立可互操作的分布式应用程序的新平台。他使得各种平台以各种不同语言和技术开发的分布式计算技术能够相互协作和交互,供现有的或潜在的客户以一些标准的方式访问。他最大特点就是松耦合、跨平台,这些特点无疑为分布式数据挖掘提供了良好的支持。??
利用Web Service技术构建一个数据挖掘系统,其应有以下几个特点:灵活的数据挖据架构,可以根据不同的应用领域,灵活和快捷地选择最合适的数据挖据方法和数据挖据算法;具有分布式的软件架构,能在更大程度上满足用户的需求;可以在一定程度上实现分布并行的数据挖掘,提高数据挖掘的效率。同时利用该技术,可以将一个挖掘任务分配到多台计算机上运行,从而实现并行数据挖掘[1]。??
2.2 Web Service的结构??
Web Service是一种面向服务的体系结构,他能够创建服务的抽象定义、提供服务的具体实现、发布并查找服务、实现服务实例选择,并实现可互操作服务的使用。Web service体系结构基于3种角色(服务提供者、服务注册中心和服务请求者)之间的交互。交互涉及发布、查找和绑定操作。服务提供者是提供最终Web Service的供应商,他既是Web Service的拥有者,负责其所拥有服务的发布、更
您可能关注的文档
最近下载
- 员工心态培训ppt课件.pptx VIP
- 直肠癌的外科治疗及进展.ppt VIP
- 2025年上海证券交易所招聘笔试预测试题及答案.doc VIP
- 料账管理课件.pptx VIP
- 能量密度指数(EII)计算方法.ppt VIP
- 红十字校本课程教学设计.docx VIP
- (正式版)Y-S-T 1700-2024 银矿采选业绿色工厂评价要求.docx VIP
- 2025年上海证券交易所招聘笔试专项练习含答案.doc VIP
- TCECA-G 0344—2025《零碳园区评价技术规范》.pdf VIP
- 第2课 春秋战国的历史巨变课件(共41张PPT)-中职高一上学期高教版(2025)中国历史全一册(含音频+视频).pptx VIP
文档评论(0)