- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
摘要
深度优先的遍历策略,结合双头表辅助结构以及合并、剪枝等一系列优化操作,
进一步减少了算法的遍历开销,从而提升了算法整体效率。
最后,本文将研究视角从静态分类数据进一步扩展至动态变化环境下,对概
化关联规则更新保持问题进行了研究,并提出了一种基于概化扩展自然序树的增
量挖掘方法GECT.IM。该方法只需扫描一次原始分类事务数据库,就可以将所
有交易中的叶子项及其概化项映射至一棵压缩格式的自然序前缀树GECT,并通
过引入更新头表来实现只对GECT中更新项集计数,然后结合相关性质及运算
就能发现大部分更新后的频繁项集,而只对部分原来非频繁的项集才需重新遍历
初始GECT树来得到,从而有效提升了挖掘效率。针对GECT规模较大以及
GECT.IM算法在部分情况下仍需遍历初始GECT树的局限性,本文进一步提出
了一种基于准频繁概化扩展自然序树的增量挖掘方法PGECT.IM。该方法通过准
最小支持度阈值的引入,结合对数据库变化范围的判定,只利用符合准最小支持
度的项集来构建PGECT,不仅可以减小树的规模,还可以有效避免GECT.IM方
法在部分情况下仍需要遍历初始GECT树的局限性,进一步提升了增量挖掘的
性能。
关键词:关联规则,多层关联规则,概化关联规则,分类数据,相关性函数,集
合枚举树,前缀树,增量挖掘
中图分类号:TP311
Abs七ract
Abstract
of in are
Withthewide becoming
technologysociety,people
applicationcomputer
in
moreandmore oninformation totheconditionof“rich
dependent systems.Facing
ofthe
in onthe statistics,database,
databut information”,based
poor development
virtualization
and
machine recognition
intelligence,pattem
learning,artificial
cameinto
new ect—data being.
interdisciplinarysubj mining
technology,a
isoneofthemost researchareasindata
Associationrule mining.
mining important
itswide and valueinthe
原创力文档


文档评论(0)