- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于进制转换的数值型关联规则分析方法
第31卷
VoL31
第9期
他9
计算机工程
ComputerEngineering
2005年5月
May2005
?
博士论文?文章编号:1000~3428C2005)09--0017--02文献标识码:A中图分类号:TP311.13
一
种基于进制转换的数值型关联规则分析方法
刘均,李人厚,郑庆华
(西安交通大学电信学院,西安710049)
摘要:针对基于区间划分的数值型天联规则分析斤法存在的问题,提出了种基十进制转换的分析方法.此方法将f进制的属性值转换
为二进制,并将二进制数值的每一位映射为二个布尔型属性,存此基础}:,再采用布尔型关联规则分析方法.相对于琏十fH】划分的方法,
此方法的优点是转化过程不存在失真,且能柯效地降低后续分析过程的时fHJ复尔度
关健词:数值型关联规则;布尔型关联规则;完整模式;进制转换
AMethodforQuantitativeAssociationRuleMiningBased0n
Decima1.binaryConversion
LIUJun,LIRenhou,ZHENGQinghua
(CollegeofElectronicsandCommunication.Xi’anJiaotongUniv~ity.Xi’an71004q)
[Abstract]Aimingattheissuesonthemethodofquamflativeassodationruleminingbasedonsectionpartition.thispaperinnxgt;duces:tmethod
basedondedmal--binaryc~mversion.Inthemethod.allnumericvaluesareconvertedintothebinaryvalues,andtheneachdigitofbinaryValuesis
mappedI()twoBooleanallribmes,themethodofBARminingisadopted1)ranalyzingtheassociationrulesbetweentheBooleanattribntes._rhe
advantagesofthismethodisthatnodistortionisintroducedduringtypeconversionofsourcedata.andthecomplexity()I’sequentBARminingcan
bereducedefficiently
【Keywords]Quantitativeassociationrule:Booleanassociati~mrule;Integratedpattern:Decimal—binaryconversi~m
关联规则是数据挖掘领域的重要研究内容,它用于揭示
同一事物不同属性(或项)之间的依赖关系.根据规则中变量
类别的不同,关联规则町以分为布尔型与数值型两种类型.
对于布尔型关联规~J]CBooleanAssociationRules,BAR),人
们已做r大量的研究,提出了Apriori,AIS,SETM,DHP
等算法….对于数值型关联规则(QuantitativeAssodation
Rules,QAR),现有的做法主要是通过划分区间的方法将其
转化为BAR问题,即按照特定标准,将属性值域划分为若
干个区间,每个区问对应一个布尔型变
目前,对于QAR问题的研究主要集巾在如何划分属性
值域的区间0.现有的间划分主嘤有两种方式:(1)使用预
定义的区间和分类进行划分.如对于”收入”属性,可划分
为”0..1000”,”1000..2000”,”2000.3000”等间.该
种是目前常用的方式,文献I31中提出的划分方法属于此类
型.(2)根据数据分布进行间划分.该种划分是动念的,划
分过程满足某种挖掘标准,如最大化规则的置信度.相对于
第一种方式,这种方式可在一定程度上减少划分l间的数
目.文献【2,4J中的划分方法属于该类型.|:述方法适用于精
度要求不高的数据挖掘应用,对于属性值域间较大或精度
要求较高的应用,如挖掘学习者16种个性属性与多种学习
行为之间的数值型关联规则,该方法存在以卜问题:(1)对数
据的模糊化必然导致挖掘结果的精度较低;(2)划分区间的数
目与属性值域的大小成正比,当值域较大时,必将指数级地
增加BAR分析过程的时间复杂度l.
l基于进豺转换的数值型关联规则分析
1.1相关概念
定义1属性模式:称,)为布尔型
属性模式,设C=,c:,…,c,},P可筒汜为(../x(‘/x/x(1
定义4完整模式(IntegratedPattern):设P∈P是某个
数值型属性,={.,
原创力文档


文档评论(0)