- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于OLAP的多维关联规则挖掘研究.pdf
第39卷第4期 东北 师 大 学报 (自然 科 学 版 ) Vo1.39 No.4
2007年 l2月 Journal of Northeast Normal University(Natural Science Edition) December 2OO7
[文章编号]1000—1832(2007)04—0054—06
基于OLAP的多维关联规则挖掘研究
胡 明,唐培丽,许建潮
(长春工业大学计算机科学与工程学院,吉林 长春 130012)
[摘 要] 针对数据仓库中的多维数据模型及OLAP技术,给出了一套行之有效的基于
OLAP的元规则指导的多维关联规则挖掘方案,最终挖掘出用户真正感兴趣的概念层次合理
的多维关联规则.实验结果表明该方案是有效的.
[关键词] 数据挖掘;多维数据模型;OLAP;多维关联规则
[中图分类号]TP 312 [学科代码】520·20 [文献标识码]A
0 引言
关联规则的概念在i993年由R.Agrawa|等人首先提出…,它是数据挖掘领域的一个重要研究方
向.关联规则通过挖掘项集之间某种潜在的关系,在大量数据中自动发现一些隐含模式和有趣的知识,
以增强决策分析能力.其中最有影响的是先验Apriori算法及其扩展【20J,Apriori算法使用逐层搜索的
迭代方法,即频繁(是一1)一项集用于搜索频繁 。项集.为压缩搜索空间(剪枝),使用Apriori性质:频繁
项集的所有非空子集都必须是频繁的H J,从而提高逐层产生频繁项集的效率.
目前已有的关联规则研究工作主要是面向一般的数据库系统,随着数据仓库及OLAP技术的快速
发展,越来越多的商业统计及财务统计都需要通过多维数据来展现,这对关联规则的挖掘方法提出了新
的要求,原有的挖掘方案及挖掘效率在一定程度上受到了限制和制约.如何利用数据仓库中的多维数据
立方体挖掘关联规则已成为一个重要的研究课题.本文通过对多维数据关联规则挖掘理论和方法进行
深入细致的研究,给出了一套行之有效的基于OLAP的多维关联规则挖掘方案.
1 OLAP与多维关联规则挖掘
1.I 多维关联规则
多维关联规则是形如x Y的蕴含式,x和y分别表示为规则的合取范式构成的逻辑公式,
Xn y=0.[5-6]例如:age(X,“30…39”)^career(“teacher”) buys(X,“iaptop”),X为表示顾客的变
量.
[收稿日期】2007-04 16
[基金项目】吉林省科技发展计划项目.
【作者简介1胡Ⅱ月(1963一),男,博士,教授,主要从事数据挖掘、人工镪能研究;许建潮(1960一),男,博士,教授,主要从事数据库、
人工智能研究.
第4期 胡明,等:基于OLAP的多维关联规则挖掘研究 55
定义1 事物集D中同时包含事务x和y的百分比,称为规则 x Y具有支持度 (suppo~),它
是概率P(XU y).
定义2 事物集D中包含X的事务数与同时包含y的事务数的百分比,称为规则x Y具有置
信度c(confidence),它是条件概率P(X f y).
支持度与置信度的计算方法:
sup( y)=(包含x和y的事务数摩务总数)×100%;
conf(X y)=(包含X和y的事务数/包含X的事务数)×100%.
同时满足最小支持度阈值和最小置信度阈值的关联规则称为强规则,也是我们希望发现的关联规
则.
1 2 联机分析关联挖掘
数据仓库是一个面向主题、集成、时变和非易失的,用来支持决策分析的数据集合[ ,允许计算和
快速访问汇总的数据.
联机分析处理(On—line Analytical Processing,0LAP),是针对特定问题的联机数据访问和分析技
术,满足决策支持或多维环境特定的需求,它的技术核心是“维”,因此,OLAP也被称为多维数据分析.
其
您可能关注的文档
- 坚持依法行政 化解行政争议——以宁波市规划系统为例.pdf
- 坚持多元投入 增强开发活力.pdf
- 坚持导师培训制,适应导师队发展需要.pdf
- 坚持社会科学与自然科学的有机统一对人才培养的重要意义.pdf
- 坚持科技兴县战略 促进县域经济.pdf
- 坚持科技创新 推进和谐发展 加快建设安全稳定重载高效的国铁强局——在全局科技大会上的讲话(摘要).pdf
- 坚持自主创新推进机器人技术研究和产业化发展.pdf
- 坚持马克思主义与时俱进的理论品质培养当代大学生创新思维能力.pdf
- 坚持马克思主义的指导地位建设社会主义核心价值体系—“建设社会主义核心价值体系”理论研讨会综述.pdf
- 坚硬厚煤层综采放顶煤预裂爆破开采技术的实践与应用.pdf
原创力文档


文档评论(0)