- 19
- 0
- 约4.33千字
- 约 19页
- 2017-11-25 发布于湖北
- 举报
数据挖掘中的关联分析
关联分析中各种属性的处理 知识回顾 1.分类属性的处理 1.1概念介绍 1.2处理方法 1.3分类属性二元化的不足 2.连续属性的处理 2.1基于离散化的方法 2.1基于统计学的方法 2.3基于非离散化的方法 关联规则挖掘假定输入数据由称作项的二元属性组成。还假定项在事物中出现比不出现更重要。这样,项被看作非对称的二元属性,且只有频繁模式才被认为是有趣的。 例: 6-2购物篮数据的二元0/1表示 从上述的购物篮数据中,我们可得出{尿布}?{啤酒}这一有趣的规则。 这一频繁项集的得出,我们可以运用:Apriori算法、Hash树法、FP增长算法等等。 关于该规则的支持度和置信度的计算如下: 上面规则的支持度s={尿布、啤酒}支持度计数/事物个数=3/5=0.6 上面规则的置信度c={尿布、啤酒}支持度计数/{尿布}支持度计数=3/4=0.75 1、处理分类属性 1.1概念介绍 上面的因特网调查数据中,像性别、家庭计算机、网上聊天、网上购物和关注隐私这些属性,我们称为对称二元属性;而像文化程度、州称之为标称属性。 1.2处理方法 对于对称二元属性,可以转化成一对二元属性如:性别分为男和女,而对于标称属性,则可以用多个二元项取代,例如:文化程度=大学,文化程度=研究生,文化程度=高中。通过这样将分类属性和对称二元属性转化成“项”之
您可能关注的文档
- 数字绘画杂谈.ppt
- 数字逻辑2-4 逻辑函数的化简方法.ppt
- 数字电路设计 第1章.ppt
- 数字逻辑01-2.ppt
- 数字系统设计--TTL电路基本原理.ppt
- 数字逻辑教学课件ppt作者王茜黄仁许光辰第2章 - 副本.ppt
- 数字逻辑与数字系统5-1.ppt
- 数字电路技术.ppt
- 数字逻辑与数字系统Chap1-1.ppt
- 数字集成电路讲义(逻辑门)ppt.ppt
- 专项十三 复合句(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项十四 There be句型和主谓一致(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项14 构词法 学案(含答案)2025年中考人教版英语语法专项复习.doc.docx
- 静脉肾盂造影结石梗阻评估.ppt
- 《假期实践活动》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 老年结石病合并慢病综合诊疗.ppt
- 鹿角形肾结石复杂手术治疗.ppt
- 经皮肾镜超声碎石清石术.ppt
- 《参观爱国主义教育基地》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 《生活中的大数:整理与复习》教案(2课时)-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
最近下载
- 2026《混凝土内部温度场的模拟分析案例》4700字.docx
- 2025广东东莞市樟木头实业投资控股集团有限公司招聘材料员1人笔试备考试题及答案解析.docx VIP
- 巴中市平昌县县级医疗机构选调笔试真题2024.pdf VIP
- 金融市场学期末考试.docx VIP
- 上海市2025年普通高校招生本科普通批次平行志愿院校专业组投档分数线.docx VIP
- 大理州工会招聘考试题及答案.doc VIP
- 三年级同步钢笔字帖练字.pdf VIP
- 高一物理必修1基本概念题(含答案).pdf VIP
- 钉磨机床设计.docx VIP
- 山东省济南市莱芜第一中学2025-2026学年高二下学期期中考试 语文试题.pdf
原创力文档

文档评论(0)