关联规则挖掘过程中的模糊化方法研讨.pdfVIP

  • 1
  • 0
  • 约1.09万字
  • 约 3页
  • 2018-01-11 发布于广东
  • 举报

关联规则挖掘过程中的模糊化方法研讨.pdf

计算机科学2002V01.29NO_.8(增刊) 关联规则挖掘过程中的模糊化方法研究¨ Research0nFuzzedMethodsfor AssociationRules Mining 陈晓云李泽霞刘幸辉彭文静 (兰州大学信息科学与工程学院 兰州730000) AbstractAssociationRulesareoneof researchfieldsindata important paper mining.This fuzzedtheconfidenceandthe ofassociationrulesbasedondata and support miningfuzzylogic. Andthenwecan moreusefulinformationandmakebetteruseoftheresultofdatamin— gain mg· Data function,Fuzz rules,Membership Keywordsmining,Association AUB(即A和B二者)的百分比。它是概率P(AU 1.引言 j B)。规则AB在事务D中具有置信度 随着数据库技术的不断发展及数据库管理系统 lA)。即是 的广泛应用,数据库中存储的数据量急剧增加,目前 B的百分比是C。这是条件概率P(B B) U 数据库系统中实际的开发应用主要是在于数据的检 support(A专B)=P(A fA) 索和查询,而蕴藏在数据库中的丰富的、有价值的信 confidence(A寺B)一P(B 息远远没有得到充分的挖掘和利用,我们迫切需要 在进行挖掘时,先给定一个支持因子的最小阈 将这些数据转换成有用的信息和知识。为了提取这 值,称为最小支持度(min—sup),置信因子的最小阈 些隐含的、事先未知的、潜在有用的信息,以满足人 值,称为最小置信度(min—conf)。满足最小支持度的 们实际工作中的需要,数据挖掘技术逐渐发展起来。 itemset)。关联规 项集,则称它为频繁项集(frequent 关联规则挖掘寻找给定数据集中项之间的有趣联 则的置信因子应不小于min—conf。 系。随着大量数据不停地收集和存储,许多业界人士 关联规则的挖掘是一个两步的过程: 对于从数据库中挖掘关联规则越来越感兴趣。 1)找出所有频繁项集:根据定义,这些项集出现 在我们实际生活中,信息往往是复杂的、不精确 的频率至少和预定义的最小支持度计数一样。 的,在一个特殊问题中所含的信息事实上总会含有

文档评论(0)

1亿VIP精品文档

相关文档