分布式数据挖掘研究(电子商务资料).docVIP

分布式数据挖掘研究(电子商务资料).doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分布式数据挖掘研究(电子商务资料) 目录 TOC \o 1-9 \h \z \u 目录 1 正文 1 文1:分布式数据挖掘研究 2 1、分布式数据挖掘的定义与框架 2 2、分布式数据挖掘系统及分类 3 3、分布式数据挖掘系统的共性问题及解决 4 第四步:基于以上三步,建立新的分布式数据挖掘系统。 5 (1)本体作用 5 (2)数据挖掘后处理方法 6 (3)自动构造问题 6 4、分布式数据挖掘算法及分类 6 5、结论 7 文2:分布式数据检索系统的设计与实现 7 1 系统设计 9 2详细设计 10 ( 1 ) 消息格式[7] 12 ( 2 )注册消息 13 ( 3 ) 部件间的握手消息 13 ( 4 ) 其他消息 13 (1)固定任务数 14 (2)动态任务分配 14 3 系统实现 14 4结 语 15 参考文摘引言: 15 原创性声明(模板) 16 文章致谢(模板) 16 正文 分布式数据挖掘研究(电子商务资料) 文1:分布式数据挖掘研究 近年来,随着信息技术、通信技术及网络技术的不断发展,广电网、移动网、互联网等网络和相关的衍生业务快速拓展,形成了大量的基于网络空间的分布式数据。这些数据中蕴藏着巨大的价值,可为决策提供依据。但是受网络平台兼容性、易购性等特征的影响,集中式数据挖掘已经难以适应分布式计算环境,这种情况下诞生了分布式数据挖掘技术,用于挖掘分布式数据价值。由于分布式数据挖掘技术刚刚兴起,很多人对这一技术的应用和系统问题了解不多,所以对分布式数据挖掘系统及其共性问题、解决方法进行分析是必要的,利于深化对分布式数据挖掘技术的应用,提高分布式数据挖掘质量。 1、分布式数据挖掘的定义与框架 定义 分布式数据网挖掘这一词汇出现较早,直至20世纪90年代后期才被人们所关注,并将其定义为基于网络空间的分布式计算环境的数据挖掘。除了这一种解读外,人们还普遍认为分布式数据挖掘是利用分布式计算方式对网络空间内的分布式数据进行挖掘,通过局部知识进行整合来获得全局知识,进而挖掘分布式数据的价值,为决策提供可靠的依据,确保决策质量。数据挖掘质量的高低,主要取决于局部知识整合方法和局部知识质量,在局部知识质量较高情况下必然可以保证数据挖掘质量。 框架 通常情况下,分布式数据挖掘遵循“全局分布、局部集中”的挖掘原则,以站点间的纯粹独立挖掘方式进行,但是并不都是独立挖掘,也可以利用某些站点进行数据挖掘。当网络空间中的某个或某些站点的计算能力、储存能力、通信能力较强时,它(它们)就可以汇集其它站点的数据,对其进行分布式数据挖掘,得到整合的局部数据挖掘结果,再借助这一结果获取全局结果。具体情况如图1所示。分布式数据挖掘中的数据主要来自于分布式计算环境中的数据,此外也有部分集中数据。无论数据来源是什么,都可以将数据分散到各站点中,利用站点进行数据的分布式挖掘,获得较高质量的数据挖掘结果。 2、分布式数据挖掘系统及分类 发展初期,分布式数据挖掘系统将系统内的数据集中起来,构建一个临时数据集市,然后集中的进行数据挖掘。这种数据挖掘方式的保密性、安全性较高,但是易给网络通讯运行造成一定困扰。而且,它采用的数据挖掘方式以集中式挖掘为主,虽然表面上是分布式数据挖掘,实质上却是集中式数据挖掘。为实现真正的分布式数据挖掘,引进国外先进技术,构筑了分布式数据挖掘系统。目前,国内分布式数据挖掘系统主要有基于网络的分布式数据挖掘系统、基于元学习的分布式数据挖掘系统、基于Multi-Agent的分布式数据挖掘系统。 基于网络的分布式数据挖掘系统 这一种分布式数据挖掘系统以互联网等现代网络为基础,具备网络资源共享、协同工作、开放服务等特点,在分布式数据挖掘中具备较高的协同性、可靠性,对保证数据挖掘质量有积极作用。特别是该种系统利用网络计算尽心分布式数据挖掘,使数据挖掘性能得到有效的提高,利于提高数据资源的利用率。 基于元学习的分布式数据挖掘系统 这一种分布式数据挖掘系统以元学习为基础,通过元学习与分布式数据挖掘系统的融合进一步优化了分布式数据挖掘算法,可以对已有的局部知识进行多次挖掘,确保了数据挖掘质量。在这一系统的框架研究上,已经有了一些显著成果,如Weka4GML框架。 基于Multi-Agent的分布式数据挖掘系统 这一种分布式数据挖掘系统以Multi-Agent系统为基础,通过Multi-Agent的自治性充分保护了局部知识挖掘结果的私有性,利于提高数据挖掘的自动化程度。同时,可以减少用户参与,实现多种算法协同挖掘,是一种高效的分布式数据挖掘技术。 基于CDM的分布式数据额挖掘系统 这一种分布式数据挖掘系统以CDM为

您可能关注的文档

文档评论(0)

ating1999 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档