- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术与联规则挖掘算法研究
摘 要
数据挖撼是致力于数据分辑翻理瓣、揭示数据内部蕴藏知
识的技术,它成为未来信息技术应用的重凄目标之一。经过十
几年的努力,数据挖掘产生了许多新概念和方法。特剐是最近
几年,~些基本摄念和方法憝于瀵壤,它灼研究正岛羞更深入
的方向发展。像其它新披术的发展历程一样,数据挖掘技术也
必须经过概念提出、概念接受、广泛研究和探索、逐步应用和
大蹩痊翔等除段。铁嚣葭戆骥状豢,大郝分学黉认为数据挖掘
的研究仍然处于广泛研究和探索阶段,追切需要在基础理论、
应用模式、系统构架以及挖掘算法和挖掘语畜等方面进行创
薪。关联筑潮挖掘是数据挖掇中成果簸丰嚣萎跑较活跃熬磷究
分支,瞬给研究者的是更深入的课题。面对大型数据瘁,关联
规则挖掘需要在挖掘效率、可用性、精确性等方面得到提升。
困诧,需要探索新静挖掘逢论和模壅;需瓣乖l用孺户的约束等
聚焦挖掘旦标;嚣要对一些传统的算法进行改进:也嚣要研究
新的更有效的算法等。鉴于爵前数据挖掘技术和关联规则挖掘
研究的现状和发展趋势。在备类蘩金的支持下,我们选择了这
一课题汗震糖关王馋。
本文的研究主要包括数据挖掘应用系统体系结构、关联规
则挖掘理论及其算法等。关于数据挖掘应用系统体系结构研究
方嚣,我翻设计了一令数据挖掘瘦瘸系统戆器型体系续梅,系
统化地分析了知识发现的基本过程和系统的各部件功能。由于
不间的源数据类型、不同的应用冈标以及不同的挖掘策略对数
据挖摇系统鳃功能舔件蝥求不霞,这麓研究主罄是麸稚诱发现
的基本过程出发,探讨系统戍具餐的主要功能部件及其相互联
系等。在关联规则挖掘理论研究上,我们首次给出了项目序列
集格空闻,并置探讨了在这个空阀上静基本搡作算子。基予顼
耳序列集格空闽及冀操住,我们慈立了关联援则挖掘模型积算
法。在关联规则挖掘算法方面,设计了基于项目序列集操作理
论的关联规则挖掘算法ISS.DM、时态约束下的关联规则挖掘
彝法TISS.DM、数据分裂下戆关联援剥撼掘算法PISS。DM。
IsS.DM算法是建立在严格的项目序列集格理论及其操作基
础上,是一个一次数据库扫描的而鼠不使用候选集的高效算
j匕京工业大掌工掌博士掌位论文
法。我们选择目前引用率较高的Apriori算法和IsS.DM进行
了对比实验。结果表明,IsS.DM执行时间整体上优于Apriori
算法,而且随着数据量的增大ISS.DM执行时间的增长幅度也
小于Apriori算法。为了提高对大型数据集挖掘的适应性,将
时态约束应用到挖掘的预处理中,改进ISS.DM成TIsS—DM。
这部分工作还包括对时态区间、时态约束下的数据挖掘空间以
及时态区间操作等进行了形式化,它们是TlSS-DM的理论基
础。对IsS.DM的另一个改进算法是PlSS.DM。它是针对大数
据集挖掘过程中对内存和CPU等系统资源要求较高的情况被
提出和设计的,采用了数据分割的方法来减少资源的占用。本
文解决了数据分割下局部频繁项目序列集和全局频繁项目序
列集的转换等问题,是一个两次扫描数据库的算法。
总之,本文在分析、归类现有数据挖掘研究成果以及原型
系统的基础上,进行了数据挖掘应用系统体系结构、关联规则
挖掘理论模型以及算法方面的研究。在项目序列集格及其操
作、时态约束挖掘空间等方面具有较好的理论价值,所设计的
算法在挖掘效率和对大型数据库挖掘的可用性方面具有潜在
的应用前景。
关键词:数据挖掘,知识发现,关联规则,项目序列集,
时态约束,数据分割。
n
Abstract
Data isa thataimsto and
miningtechnique analyze
Understandsourcedataand
large reveal hidden
knowledge
inthedata。It
hasbeenviewedasan in
您可能关注的文档
最近下载
- 《飞机维修基本技能(活页式)》课件 模块1 航空紧固件拆装和保险.pdf
- 城市地下综合管廊运行维护及安全技术标准 .pdf VIP
- 检验科临检室上岗考核试题(有答案) .pdf VIP
- 工程化仿生杂化膜囊泡及其制备方法.pdf VIP
- 高二政治(走进高二)-哲学与文化【开学第一课】课件(共20张PPT)(含音频+视频).pptx VIP
- 混凝土索赔协议书模板.docx VIP
- 建筑工程图集 16D303-3:常用水泵控制电路图.pdf VIP
- Cadence Allegro PCB封装建库规则.doc VIP
- 电气识图及CAD 电气接线图的绘制与识图 项目四电气接线图的绘制与识图.pptx VIP
- LMV5.系统概述-中文.pdf VIP
文档评论(0)