- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章在大型数据库中挖掘关联规则 报告人:张荣祖 2001/11/28 6.6.1 基于约束的挖掘 使用约束的必要性 在数据挖掘中常使用的几种约束: 知识类型约束:指定要挖掘的知识类型 如关联规则 数据约束: 指定与任务相关的数据集 Find product pairs sold together in Vancouver in Dec.’98. 维/层次约束:指定所用的维或概念结构中的层 in relevance to region, price, brand, customer category. 规则约束:指定要挖掘的规则形式(如规则模板) 单价 (price $10)的交易项目可能引发购买总额 (sum $200). 兴趣度约束:指定规则兴趣度阈值或统计度量 如 (min_support ? 3%, min_confidence ? 60%). 假定AllElectronics的一个销售多维数据库有如下关系: Sales(customer_name,item_name,transaction_id) Lives(customer_name,region,city) Items(item_name,category,price) Transaction(transaction_id,day,month,year) (1) mine associations as (2)lives(C,_,”Pudong”)^sales(C,{I},{S})=sales(C,{J}{T}) (3) from sales (4)where S.year=1999 T.year=1999 I.category=J.category (5)group by C,I.category (6)having sum(I.price=100)min(J.price)=500 (7)with support threshold=1% (8)with confidence threshold=50% Lives(C,_,”Pudong”)^Sales(C,”Census_CD”,_)^Sales(C,”MS/Office”,_)=Sales(C,”MS/SQLSever”,_) [1.5%,65%] 6.6.2 约束的分类 单调性约束(monotone constraint) 反单调性约束(anti-monotone constraint) 可转变的约束(convertibale constraint) 简洁性约束(succinct constraint) 约束的有关概念 项目集:I={i1,i2,……,im}, 交易:T=tid,It 模式S是项目集的子集,S={ij1,ij2,…,ijk} 模式S包含与T,T=tid,It,iff S=It; S’是S的子模式(subpattern)且S 是S’的超模式(superpattern),if 有S’=S. 约束的有关概念(续) 定义约束: C是作用于项目集I的幂集(powerset)上的谓词,C(S)=True/False; 满意模式集(satisfying pattern set) SATc(I)是指那些完全满足约束C的项目集的全体 将约束条件用于频繁集的查询无非是找出那些满足C的频繁集 单调和反单调的规则约束 规则 Ca 是 反单调的(anti-monotone) iff 对于任给的不满足Ca的项集(模式) S, 不存在S的超集能够满足 Ca e.g: Ca : min(S)=v , v是S的一个项集 约束Cm 是单调的iff.对于任给的满足Cm的项集(模式) S, 每一个S的超集都能够满足 Cm e.g: Cm : min(S)=v, v是S的一个项集 单调/反单调性约束描述 可转变的约束 1 反单调可转变的 1. C(S)既不是单调性约束,也不是反单调性约束; 2.若存在顺序R,使得经R排序后的I具有如下性质: 任给 S’∈{suffix_S}, if C(S)=C(S’) 则C(S)是反单调可转变的 可转变性约束的例子1: Avg(S) ? V 令I为一组以升序排列数值的项目集 E.g. I={1,3,4,6,8,9, }, R意指升续 Avg(S) = v 是反单调可转变的 如果 S ’ 是S的一个后缀, 那么avg(S’) = avg(S) {6,8,9} is a suffix of {3,4,6,8,9} avg({6,8,9})=23/3 ? a
您可能关注的文档
- 附录B 人脸和表情识别 图像工程(第2版)下册图像理解教学课件.ppt
- 附录C 基于内容的图象和视频检索 图像工程(第2版)下册图像理解教学课件.ppt
- 第1章 绪论 图像工程(第2版)中册_图像分析教学课件.ppt
- 第2章 相关图象基础 图像工程(第2版)中册_图像分析教学课件.ppt
- 第3章 数字化的图象 图像工程(第2版)中册_图像分析教学课件.ppt
- 第4章 图象分割基础 图像工程(第2版)中册_图像分析教学课件.ppt
- 第5章 特色分割算法 图像工程(第2版)中册_图像分析教学课件.ppt
- 第1章-导论 国际经济学课件.ppt
- 第6章 分割技术扩展 图像工程(第2版)中册_图像分析教学课件.ppt
- 第2章-比较优势原理 国际经济学课件.ppt
最近下载
- 2024年新人教道德与法治一年级上册全册教学课件(新版教材).pptx
- 一种去除皮革醛类VOCs的方法.pdf VIP
- 党员发展对象思想汇报.doc VIP
- 07 文言文四类实词积累方法(文言文阅读)-2026年高考语文一轮复习之古诗文专题课件(全国通用).pptx
- 网御网络审计系统V3.0用户使用手册.doc.pdf VIP
- 泥水工劳务承包合同(2024版).docx VIP
- 初三英语完形填空十篇(含答案).docx VIP
- 球磨机设计完整版.doc VIP
- 2024年《关于加快经济社会发展全面绿色转型的意见》学习解读课件.pptx VIP
- DB44_T 2693-2025电化学储能电站安全管控技术规范.pdf VIP
文档评论(0)