一种基于进制转换的数值型关联规则分析方法.docVIP

一种基于进制转换的数值型关联规则分析方法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于进制转换的数值型关联规则分析方法 第31卷 VoL31 第9期 他9 计算机工程 ComputerEngineering 2005年5月 May2005 ? 博士论文?文章编号:1000~3428C2005)09--0017--02文献标识码:A中图分类号:TP311.13 一 种基于进制转换的数值型关联规则分析方法 刘均,李人厚,郑庆华 (西安交通大学电信学院,西安710049) 摘要:针对基于区间划分的数值型天联规则分析斤法存在的问题,提出了种基十进制转换的分析方法.此方法将f进制的属性值转换 为二进制,并将二进制数值的每一位映射为二个布尔型属性,存此基础}:,再采用布尔型关联规则分析方法.相对于琏十fH】划分的方法, 此方法的优点是转化过程不存在失真,且能柯效地降低后续分析过程的时fHJ复尔度 关健词:数值型关联规则;布尔型关联规则;完整模式;进制转换 AMethodforQuantitativeAssociationRuleMiningBased0n Decima1.binaryConversion LIUJun,LIRenhou,ZHENGQinghua (CollegeofElectronicsandCommunication.Xi’anJiaotongUniv~ity.Xi’an71004q) [Abstract]Aimingattheissuesonthemethodofquamflativeassodationruleminingbasedonsectionpartition.thispaperinnxgt;duces:tmethod basedondedmal--binaryc~mversion.Inthemethod.allnumericvaluesareconvertedintothebinaryvalues,andtheneachdigitofbinaryValuesis mappedI()twoBooleanallribmes,themethodofBARminingisadopted1)ranalyzingtheassociationrulesbetweentheBooleanattribntes._rhe advantagesofthismethodisthatnodistortionisintroducedduringtypeconversionofsourcedata.andthecomplexity()I’sequentBARminingcan bereducedefficiently 【Keywords]Quantitativeassociationrule:Booleanassociati~mrule;Integratedpattern:Decimal—binaryconversi~m 关联规则是数据挖掘领域的重要研究内容,它用于揭示 同一事物不同属性(或项)之间的依赖关系.根据规则中变量 类别的不同,关联规则町以分为布尔型与数值型两种类型. 对于布尔型关联规~J]CBooleanAssociationRules,BAR),人 们已做r大量的研究,提出了Apriori,AIS,SETM,DHP 等算法….对于数值型关联规则(QuantitativeAssodation Rules,QAR),现有的做法主要是通过划分区间的方法将其 转化为BAR问题,即按照特定标准,将属性值域划分为若 干个区间,每个区问对应一个布尔型变 目前,对于QAR问题的研究主要集巾在如何划分属性 值域的区间0.现有的间划分主嘤有两种方式:(1)使用预 定义的区间和分类进行划分.如对于”收入”属性,可划分 为”0..1000”,”1000..2000”,”2000.3000”等间.该 种是目前常用的方式,文献I31中提出的划分方法属于此类 型.(2)根据数据分布进行间划分.该种划分是动念的,划 分过程满足某种挖掘标准,如最大化规则的置信度.相对于 第一种方式,这种方式可在一定程度上减少划分l间的数 目.文献【2,4J中的划分方法属于该类型.|:述方法适用于精 度要求不高的数据挖掘应用,对于属性值域间较大或精度 要求较高的应用,如挖掘学习者16种个性属性与多种学习 行为之间的数值型关联规则,该方法存在以卜问题:(1)对数 据的模糊化必然导致挖掘结果的精度较低;(2)划分区间的数 目与属性值域的大小成正比,当值域较大时,必将指数级地 增加BAR分析过程的时间复杂度l. l基于进豺转换的数值型关联规则分析 1.1相关概念 定义1属性模式:称,)为布尔型 属性模式,设C=,c:,…,c,},P可筒汜为(../x(‘/x/x(1 定义4完整模式(IntegratedPattern):设P∈P是某个 数值型属性,={.,

文档评论(0)

beoes + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档