关联 什么是频繁模式分析? 频繁模式: 在数据集中频繁出现的模式(项集, 子序列, 子结构等) 动机: 找出数据中的内在规律性 哪些产品经常被一起购买?— Beer and diapers?! 购买了PC之后下一个会买什么? 何种DNA对这个新药敏感? 能否自动分类web文档? 应用 购物篮分析, cross-marketing, 商品目录设计, 促销活动分析, Web日志(点击流)分析, DNA序列分析 例:候选项集生成 由:L3 = {abc, abd, acd, ace, bcd } Step-1:自连接L3*L3 abcd from abc 和abd acde from acd 和ace Step-2: 剪枝 由于ade 不在L3 中, acde 被删除 得:C4 = {abcd } * * 基本概念: 频繁模式和关联规则 项集X = {x1, …, xk} 找出满足最小支持度和置信度的所有规则X ? Y 支持度 s, 一笔交易包含X?Y的概率 置信度 c, 一笔包含X的交易也包含Y的条件概率 令 supmin = 50%, confmin = 50% 频繁模式: {A:3, B:3, D:4, E:3, AD:3} 关联规则: A ? D (60%, 100%) D ? A (60%, 75%) 买尿布的客户 两者都买的客户 买啤酒的客户 Transaction
您可能关注的文档
最近下载
- 2024四川自贡市本级招用高校毕业生从事公共服务72人备考试题及答案解析.docx VIP
- 工艺标准-IPC-TM-650 CN测试方法手册.pdf VIP
- 【MOOC答案】《现代密码学》(电子科技大学)章节作业慕课答案.docx
- 2022—2023年度广东省职业院校学生专业技能大赛CAD机械设计赛项竞赛规程.pdf VIP
- 五年(2021-2025)高考历史真题分类汇编专题24 世界史(材料分析题、观点论述题)(全国通用)(原卷版).docx VIP
- 肠梗阻导管在防治肠梗阻中的临床应用专家共识.pptx VIP
- 2026湖南永州市市直企事业单位引进急需紧缺专业人才206人备考题库附答案.docx VIP
- 个性化营养评估技术指南团体标准.pptx
- 2025年河北省石家庄市中考地理试卷(含答案).docx
- 2023年广东省深圳市中考物理一模试卷.docx VIP
原创力文档

文档评论(0)