- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向服务数据挖掘平台体系结构研究
面向服务数据挖掘平台体系结构研究
摘要:针对当前数据挖掘软件中普遍存在的功能耦合过于紧密#65380;资源共享程度不高#65380;软件难以重用#65380;可扩展性不好等问题,提出了一种面向服务的数据挖掘平台(SODMP)的概念模型,并给出了SODMP平台的设计方案。该平台由DM应用#65380;DM服务代理#65380;DM服务#65380;操作系统接口四部分组成,在结构上实现了应用与服务的分离,具有开放#65380;灵活#65380;易重用#65380;易扩展等特点。
关键词:体系结构; 面向服务; 数据挖掘; 软件平台
中图分类号:TP31文献标志码:A
文章编号:1001-3695(2008)02-0440-03
0引言
随着计算机应用的普及以及计算机技术的飞速发展,各行各业均积累了大量的业务数据。越来越多的企业管理者意识到这些业务数据中蕴涵着丰富的有价值的知识,充分发掘出这些知识将可以对企业决策起到很好的辅助作用。因此,数据挖掘作为知识发现领域中的一个核心技术一直是众多学者研究的热点。数据挖掘包括了分类#65380;聚类#65380;关联规则#65380;序列模式等几个类别机器学习算法。在国外,数据挖掘已经在金融#65380;保险#65380;医疗#65380;电信等许多行业投入了应用。在国内,已经有很多数据挖掘技术的理论,但数据挖掘软件的实际应用则刚刚起步[1,2]。
随着互联网的普及以及Web技术的不断成熟,面向服务的体系结构(service oriented architecture,SOA)成为近年来软件模式研究领域的一个新热点。Gartner的最新报告显示,2006年将有60%以上的企业考虑以SOA为指导原则来设计关键任务应用和流程;到2008年,SOA将为80%的新开发项目提供实施基础[3]。
目前,市场上已有很多流行的数据挖掘软件,主要为国外产品,如SAS的Enterprise Miner#65380;SPSS的Clementine以及IBM的Intelligent Miner等。这些数据挖掘软件基本均为用户提供了一些经典的和部分自行研究的数据挖掘算法,但在数据预处理和结果可视化方面提供的功能则较为有限。这样一来,用户要使用这些数据挖掘软件,往往要借助其他工具和方法完成大量的数据预处理工作。更值得关注的是,出于竞争等多方面原因,这些商业数据挖掘软件内部功能模块之间基本都是紧耦合关系。每个算法与其分析结果的可视化功能紧紧绑定在一起,没有向用户提供调用接口,用户除了接受软件厂商制定的所有使用规则外别无选择。这些软件也不会为用户提供功能的扩展接口。用户只能使用现有的算法,无法通过增添其他算法来扩展软件功能,也不可能在几种软件之间进行功能的优化重组。因此,如何设计一个松散耦合的#65380;支持功能模块的重用和优化重组且容易扩展的数据挖掘平台成为一个值得研究的问题。
文献[4]将数据挖掘与服务率技术应用到SOA中,提出了一个扩展的SOA架构,通过对服务和服务使用的挖掘来解决服务的发现和自动编排问题,并引入服务率作为对服务质量的评价参考。文献[5]提出了一个面向服务的知识发现体系结构――SOA4KD,重点研究了基于自然语言的知识发现需求获取方法和知识发现服务质量测度方法,但要求用户的需求限制在一个有限的集合内。文献[6]提出一种与平台无关的数据挖掘服务中心,具有一定的灵活性和可重用性,但没有论述如何进行功能的扩展。这些不足正是本文研究的出发点。
1相关背景研究
1.1面向服务的体系结构
服务就是定义好的#65380;可供调用的业务功能单元[7]。面向服务的体系结构是一种架构方式,其目的是实现相互作用的软件功能单元之间的松散耦合[8]。SOA的基本思想是以服务为核心,将企业的IT资源整合成可操作的#65380;基于标准的服务,使其能被重新组合和应用[9]。这种重新组合,使那些原本趋于闲置的IT资源重新发挥作用,从而使企业的资源得到优化,并焕发出新的生机。
如图1所示,面向服务的体系结构主要由三部分组成:a)服务请求者(service consumer)。它是服务的消费者,负责向服务代理查找自己需要的服务;b)服务提供者(service provider)。它是服务的生产者,负责将自己能够提供的服务发布到服务代理;c)服务代理(service broker)。它相当于一个中介机构,负责将服务提供者发布的服务编成目录,供服务请求者查找。服务请求者通过服务代理一旦查到自己需要的服务,就直接与服务提供者绑定,并使用服务提供者提供的服务。服务代理的增加在一定程度上实现了服务请求者与服务提供者间的松散耦合,实现了服
原创力文档


文档评论(0)