含负项的关联规则挖掘研究综述.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
含负项的关联规则挖掘研究综述 ?,年 月 四川师范大学学报 自然科学 版??? 第卷第期含负项的关联规则挖掘研究综述 冯山? 游晋孥?四川师范大学数学与软件科学学院,四川成都;?晋中师范高等 专科学校数学系,山西晋中摘要:关联规则挖掘是数据挖掘研究的一个重要领域, 传统的关联规则仅反映了正项之间的关联关系, 无法反映出数据Z间隐藏的负关联关系?从以下方面对含负项的关联规则挖 掘进行了综述:引入负项的原 因,包含正、负项的关联规则概念及相关术语,最新的含负项关联规则研究情 况,经典算法的讨论?最后,展 望了含负项关联规则领域未来的研究方向. 关键词:一般化关联规则;负关联规则;负项口;数据挖掘 中图分类号:文献标志码:文章编号:?一 一:?/?????? 关联规则是数据挖掘研究的重要课题之一,其 感兴趣的.为避免混淆,我们 将这种关系,即形如 目的是发现大量数据之间有趣的联系??自从?、,及,的关联规则称为负关 联规则?其 中,和】,是出现在事务中的项目的集合,出现在 等 提出关联规则的挖掘 问题以来,许多 事务中的项目称为正项目简称正项,而 和 学者对此进行了大量的研究?传统的关联规则 是不出现在事务中的项目的集合,对应的项目称为 描述的是事务库中岀现的事务之间的蕴涵关系,即 负项目简称负项?把规则的前件或后件屮既包含 形如的表达式?其中,和是出现在事务数 正项又包含负项的形如,的关联规则 据库中的事务,它们是构成事务的项目的集合,分 称为一般化关联规则. 别称为规则的前件和后件?显然,关联规则所反映 目前,不同的学者从不同的角度对包含负项的 的蕴含关系在现实生活中可以用来指导人们进行 关联规则进行了研究,指出了此类关联规则研究的 某种决策?例如,对商店的顾客事务零售数据进行 重要性,但研究思路、方法和内容差异各有侧重,研 分析时,一个可能的规则是:顾客购买计算机的同 究的结果往往也只能适应特定情境?为此,本文对 时也会购买杀毒软件?它可以帮助商家完成商品的 现有的含负项的关联规则挖掘算法的各类研究成 组合销售规划或进行售后数据分析. 果进行了分析和归类,对其中的一些经典算法进行 ],形式的规则称为正关联规则?在实际应 了讨论,在此基础上提出了该领域在未来的研究中 用屮,我们会发现还存在除此以外的有价值的规则 需要解决的几个主要问题. 形式,它们反映了完全不同的决策问题. 问题顾客购买了某些商品,是不是一定不 基本概念 购买某些其他商品. 问题 顾客不购买某些商品,是不是一定购假设任务相关的事务数据库的项 集 9 买某些其他商品. ,,,,是任务相关的事务数据库, 问题顾客不购买某些商品,是不是一定不 ,为的第?『个事务,则,,购买某些其他商品?,,是项集,中的项 所构成的子项集,即 面对这样的决策问题,用传统的规则挖掘方法 每一个;有唯一的标识,记 作? 无法得到其对应的蕴含关系或规则,用传统的规则 假设是项集,的子集,是某个事务,如果 形式也无法回答或表述它们,而它们往往是我们所 ,那么称事务包含 收稿丹期:? ?基金项目:四川省教育厅自然科学重点基金资助项目 作者简介:冯山一,男,副教授,主要从事智能软件平台开发和数据挖掘的 研究第期冯山,等:含负项的关联规则挖掘研究综述如果某项G,称该项为 正项?与此对应,如 支持度计数为?,那么的支持度计数为? 果项厶,称该项为负项,记为???,其中,表示数据库中 假设 是某个事务,对于项W,,如果隹 事务的总个数?W W凡,则由负 项,构成的集合称为负项集,记 负关联规则的支持度和置信度的计算 为已,厶,W W ?显然,负项集 负关联规则是一般化关联规则的特殊情形.由 是指不出现在事务屮的项的集合,它不是事务 于它的特殊性,其支持度和置信度可以利用正频繁 中的项集 的补集,只表示不岀现在事务中的项 项集的支持度和置信度得到. 目的子集?相应地,正项的集合称为正项集,类似地 定理设非空项集,】,,,且,有: 记为,,厶w , W W ?—; 定义如果,,,,口 ,称一; 蕴涵式为正关联规则.一; 定义 如果,,,,,,,】,,且、、一一、中的任意两个的交集为空,称 蕴涵式、 ,及为负关联规则或含负项的关联规则. 可见,涉及负项的关联规则的支持度的计算可 定义如果、,、、都包含于,且和 以由正项集的支持度获得.由定理及置信度的定 不同时为空,,与雪不同时为空,、、、中任意 义,很容易得到负关联规则的置信度计算方法. 两个的交集为空,则蕴涵式称为一般 推论设非空项集,,且,有: 化关联规则?即对每一条支持该规则的事务,只。兰巳一 有、,同时出现在事务 中,而、不出现在事 务屮?可见,负关联规则和正关联规则是一般化; 关联规则的特殊情形?若无特别说明,后面的讨论啦; 中均表示一般化关联规

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档