- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于约束的关联规则.ppt
第六章在大型数据库中挖掘关联规则 报告人:张荣祖 2001/11/28 6.6.1 基于约束的挖掘 使用约束的必要性 在数据挖掘中常使用的几种约束: 知识类型约束:指定要挖掘的知识类型 如关联规则 数据约束: 指定与任务相关的数据集 Find product pairs sold together in Vancouver in Dec.’98. 维/层次约束:指定所用的维或概念结构中的层 in relevance to region, price, brand, customer category. 规则约束:指定要挖掘的规则形式(如规则模板) 单价 (price $10)的交易项目可能引发购买总额 (sum $200). 兴趣度约束:指定规则兴趣度阈值或统计度量 如 (min_support ? 3%, min_confidence ? 60%). 假定AllElectronics的一个销售多维数据库有如下关系: Sales(customer_name,item_name,transaction_id) Lives(customer_name,region,city) Items(item_name,category,price) Transaction(transaction_id,day,month,year) (1) mine associations as (2)lives(C,_,”Pudong”)^sales(C,{I},{S})=sales(C,{J}{T}) (3) from sales (4)where S.year=1999 T.year=1999 I.category=J.category (5)group by C,I.category (6)having sum(I.price=100)min(J.price)=500 (7)with support threshold=1% (8)with confidence threshold=50% Lives(C,_,”Pudong”)^Sales(C,”Census_CD”,_)^Sales(C,”MS/Office”,_)=Sales(C,”MS/SQLSever”,_) [1.5%,65%] 6.6.2 约束的分类 单调性约束(monotone constraint) 反单调性约束(anti-monotone constraint) 可转变的约束(convertibale constraint) 简洁性约束(succinct constraint) 约束的有关概念 项目集:I={i1,i2,……,im}, 交易:T=tid,It 模式S是项目集的子集,S={ij1,ij2,…,ijk} 模式S包含与T,T=tid,It,iff S=It; S’是S的子模式(subpattern)且S 是S’的超模式(superpattern),if 有S’=S. 约束的有关概念(续) 定义约束: C是作用于项目集I的幂集(powerset)上的谓词,C(S)=True/False; 满意模式集(satisfying pattern set) SATc(I)是指那些完全满足约束C的项目集的全体 将约束条件用于频繁集的查询无非是找出那些满足C的频繁集 单调和反单调的规则约束 规则 Ca 是 反单调的(anti-monotone) iff 对于任给的不满足Ca的项集(模式) S, 不存在S的超集能够满足 Ca e.g: Ca : min(S)=v , v是S的一个项集 约束Cm 是单调的iff.对于任给的满足Cm的项集(模式) S, 每一个S的超集都能够满足 Cm e.g: Cm : min(S)=v, v是S的一个项集 单调/反单调性约束描述 可转变的约束 1 反单调可转变的 1. C(S)既不是单调性约束,也不是反单调性约束; 2.若存在顺序R,使得经R排序后的I具有如下性质: 任给 S’∈{suffix_S}, if C(S)=C(S’) 则C(S)是反单调可转变的 可转变性约束的例子1: Avg(S) ? V 令I为一组以升序排列数值的项目集 E.g. I={1,3,4,6,8,9, }, R意指升续 Avg(S) = v 是反单调可转变的 如果 S ’ 是S的一个后缀, 那么avg(S’) = avg(S) {6,8,9} is a suffix of {3,4,6,8,9} avg({6,8,9})=23/3 ? a
您可能关注的文档
- 北京自考语言学概论教材答案最新版(简答题).doc
- 北师大版《信任》课件.ppt
- 北师大版初中数学定理知识点汇总七年级上册.doc
- 北理自控(复习要点).doc
- 区域填充算法的研究.doc
- 医务人员手卫生知识考试题.doc
- 医学免疫学与微生物学期末复习题.doc
- 医学各大系统重点精华总结诊断公式+辅助检查+治疗原.doc
- 医学各大系统重点精华总结诊断公式+辅助检查+治疗原则档.doc
- 医学统计学模拟试题(A).doc
- 浙江衢州市卫生健康委员会衢州市直公立医院高层次紧缺人才招聘11人笔试模拟试题参考答案详解.docx
- 浙江温州泰顺县退役军人事务局招聘编外工作人员笔试备考题库及参考答案详解一套.docx
- 江苏靖江市数据局公开招聘编外工作人员笔试模拟试题及参考答案详解.docx
- 广东茂名市公安局电白分局招聘警务辅助人员40人笔试模拟试题带答案详解.docx
- 江苏盐城市大丰区住房和城乡建设局招聘劳务派遣工作人员4人笔试模拟试题带答案详解.docx
- 浙江舟山岱山县东沙镇人民政府招聘笔试模拟试题及参考答案详解1套.docx
- 最高人民检察院直属事业单位2025年度公开招聘工作人员笔试模拟试题含答案详解.docx
- 浙江金华市委宣传部、中共金华市委网信办所属事业单位选调工作人员笔试备考题库及答案详解1套.docx
- 广东深圳市党建组织员招聘40人笔试模拟试题及答案详解1套.docx
- 江苏南京水利科学研究院招聘非在编工作人员4人笔试模拟试题及参考答案详解.docx
文档评论(0)