- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多数据库系统的多层关联规则挖掘技术研究和实现摘
基于多数据库系统的多层关联规则挖掘技术研究和实现
摘 要
随着计算机技术的飞速发展和信息时代的到来,在网络分布式环境下,如何 进行有效的数据挖掘已成为数据库研究领域一个新的课题。关联规则挖掘是数据 挖掘研究的一个重要方面。本文主要从多事务同构数据库系统的角度出发,针对 多层关联规则挖掘的理论和方法进行了深入研究,提出若干解决方法和算法。具 体研究内容如下:
1)分析现有概念树的生成和表示方法,结合网络多数库环境下数据分布的 特性,采用由局部概念树合并成全局概念树方法,用XML语言对概念树描述并 进行网间传输,用以减少通讯量。由此可以从动态调整后的概念树中,提取出指 导跨层挖掘的信息。
21针对网络多事务数据库系统提出一种基于FP-Tree的多层关联规则挖掘算 法ML DFPT。ML DFPT最多只需扫描数据库三遍,且不用产生大量的候选项 集,可有效减少了通讯量,从而提高规则挖掘的有效性。并通过对ML_DFPT算 法进行部分修改,使算法可根据跨层挖掘信息在特定的层间挖掘出层间关联规 则。
3)通过对现有规则表示法和规则本身的分析,提出一种树型关联规则的表示
法,使用户可以分层、分类浏览规则,并可降低冗余性、提高可读性。
以上提出的算法和解决方案己通过原型系统的实验,结果证明ML DFPT算
法和相关技术是有效的、可行的。
关键词:数据挖掘,概念树,XML,多层关联规则,多事务数据库系统,频繁模
式树.
基于多数据库系统的多层关联规则挖掘技术研究和实现Abstract
基于多数据库系统的多层关联规则挖掘技术研究和实现
Abstract
Wkh the coming of rapid development of computer technology and information era,how to mine efficient knowledge from under distributed environment becomes a new topic in database research areas.Association rule mining is an important task of data mining.In this thesis,we focus on research on distributed mining multiple level associations rules,and propose several solutions and efficient distribute algorithms. The following iS our main research WOrks:
1)we first analyze the present generation and specification of conceptual hierarchies and consider the characters of distributed environment.Then in this paper we generate the global conceptual hierarchy by merging the local conceptual hierarchies,use XML to specify and translate the conceptual hierarchies,and get the CROSS level mining information from dynamic adjusted global conceptual hierarchy.
2)we introduce algorithm ML_DFPT(Multiple Level Distribute Frequent Pattern Tree)for distribute mining of frequent pattems,based on FP—growth mining,that uses only three full I/O scans of the database,eliminating the need for generating the
candidate items,and reducing the communication cost.By modifying,the algorithm
ML—DFPT Can also distribute mine of CROSS level association rules using cross level mining information.
3)B
您可能关注的文档
- 基于多模型的自适应控制系统的研究-机械电子工程专业论文.docx
- 基于改进小波包逆变器谐波分析与检测的研究-控制科学与工程专业论文.docx
- 基于多模型动车组制动过程PID控制-控制工程专业论文.docx
- 基于改进小波神经网络的故障识别方法研究-控制理论与控制工程专业论文.docx
- 基于多模型决策融合的空分过程故障检测与预报-系统工程专业论文.docx
- 基于改进小波神经网络的模拟电路故障诊断研究-电路与系统专业论文.docx
- 基于改进小波神经网络的自动癫痫检测-信号与信息处理专业论文.docx
- 基于改进形态滤波器和HHT的电力系统谐波间谐波检测新方法-电力系统及其自动化专业论文.docx
- 基于多平台的证书功能库的设计实现及基本的PKI框架的构建-计算机应用技术专业论文.docx
- 基于改进形态学指数的ZY3影像建筑物和阴影的提取及应用-测绘工程专业论文.docx
- 基于改进遗传算法的控制参数研究-电路与系统专业论文.docx
- 基于多数据来源的糖尿病经济负担方法学及实证研究药事管理专业论文.docx
- 基于改进遗传算法的控制系统在倒立摆中的应用-控制理论与控制工程专业论文.docx
- 基于改进遗传算法的冷链物流路径优化研究-物流工程专业论文.docx
- 基于改进遗传算法的滦河下游水资源优化配置分析-农业水土工程专业论文.docx
- 基于改进遗传算法的模糊聚类分析及应用-电路与系统专业论文.docx
- 基于多数据源的热点话题自动发现技术研究-通信与信息系统专业论文.docx
- 基于改进遗传算法的农产品物流配送车辆路径优化研究-交通运输规划与管理专业论文.docx
- 基于多数据源融合的电网故障诊断方法研究-电气工程专业论文.docx
- 基于多水平模型边疆民族地区农户非农劳动行为研究——以云南省红河哈尼族彝族自治州为例-统计学专业论文.docx
原创力文档


文档评论(0)