基于OLAP的多维关联规则挖掘研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于OLAP的多维关联规则挖掘研究.pdf

第39卷第4期 东北 师 大 学报 (自然 科 学 版 ) Vo1.39 No.4 2007年 l2月 Journal of Northeast Normal University(Natural Science Edition) December 2OO7 [文章编号]1000—1832(2007)04—0054—06 基于OLAP的多维关联规则挖掘研究 胡 明,唐培丽,许建潮 (长春工业大学计算机科学与工程学院,吉林 长春 130012) [摘 要] 针对数据仓库中的多维数据模型及OLAP技术,给出了一套行之有效的基于 OLAP的元规则指导的多维关联规则挖掘方案,最终挖掘出用户真正感兴趣的概念层次合理 的多维关联规则.实验结果表明该方案是有效的. [关键词] 数据挖掘;多维数据模型;OLAP;多维关联规则 [中图分类号]TP 312 [学科代码】520·20 [文献标识码]A 0 引言 关联规则的概念在i993年由R.Agrawa|等人首先提出…,它是数据挖掘领域的一个重要研究方 向.关联规则通过挖掘项集之间某种潜在的关系,在大量数据中自动发现一些隐含模式和有趣的知识, 以增强决策分析能力.其中最有影响的是先验Apriori算法及其扩展【20J,Apriori算法使用逐层搜索的 迭代方法,即频繁(是一1)一项集用于搜索频繁 。项集.为压缩搜索空间(剪枝),使用Apriori性质:频繁 项集的所有非空子集都必须是频繁的H J,从而提高逐层产生频繁项集的效率. 目前已有的关联规则研究工作主要是面向一般的数据库系统,随着数据仓库及OLAP技术的快速 发展,越来越多的商业统计及财务统计都需要通过多维数据来展现,这对关联规则的挖掘方法提出了新 的要求,原有的挖掘方案及挖掘效率在一定程度上受到了限制和制约.如何利用数据仓库中的多维数据 立方体挖掘关联规则已成为一个重要的研究课题.本文通过对多维数据关联规则挖掘理论和方法进行 深入细致的研究,给出了一套行之有效的基于OLAP的多维关联规则挖掘方案. 1 OLAP与多维关联规则挖掘 1.I 多维关联规则 多维关联规则是形如x Y的蕴含式,x和y分别表示为规则的合取范式构成的逻辑公式, Xn y=0.[5-6]例如:age(X,“30…39”)^career(“teacher”) buys(X,“iaptop”),X为表示顾客的变 量. [收稿日期】2007-04 16 [基金项目】吉林省科技发展计划项目. 【作者简介1胡Ⅱ月(1963一),男,博士,教授,主要从事数据挖掘、人工镪能研究;许建潮(1960一),男,博士,教授,主要从事数据库、 人工智能研究. 第4期 胡明,等:基于OLAP的多维关联规则挖掘研究 55 定义1 事物集D中同时包含事务x和y的百分比,称为规则 x Y具有支持度 (suppo~),它 是概率P(XU y). 定义2 事物集D中包含X的事务数与同时包含y的事务数的百分比,称为规则x Y具有置 信度c(confidence),它是条件概率P(X f y). 支持度与置信度的计算方法: sup( y)=(包含x和y的事务数摩务总数)×100%; conf(X y)=(包含X和y的事务数/包含X的事务数)×100%. 同时满足最小支持度阈值和最小置信度阈值的关联规则称为强规则,也是我们希望发现的关联规 则. 1 2 联机分析关联挖掘 数据仓库是一个面向主题、集成、时变和非易失的,用来支持决策分析的数据集合[ ,允许计算和 快速访问汇总的数据. 联机分析处理(On—line Analytical Processing,0LAP),是针对特定问题的联机数据访问和分析技 术,满足决策支持或多维环境特定的需求,它的技术核心是“维”,因此,OLAP也被称为多维数据分析. 其

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档