数据挖掘的概念和技术__北大.ppt

关系数据库 面向对象数据库 文本数据 多媒体数据 异构数据 WWW数据 数据挖掘分类 ——挖掘技术 数据库技术 机器学习技术 统计技术 神经网络技术 可视化技术 …… 数据挖掘原理与方法 关联(Association) 反映一个事件和其他事件之间依赖或关联的知识 如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测 可以用关联规则的形式表示 规则形式: “Body ? Head [support, confidence]”. 举例: contains(T, “computer”) →contains(T, “software”) [support = 1%, confidence = 75%] age(X, “20..29”) ^ income(X, “20..29K”) → buys(X, “PC”) [2%, 60%] 应用: 业务相关性分析、交叉销售、产品目录设计等 关联规则(一) X ? Y 满足X中条件的数据库元组也满足Y中条件 规则兴趣度度量 支持度 置信度 强规则 同时满足最小支持度阈值和最小置信度阈值的规则 关联规则(二) 给定: (1)交易数据库 (2)每笔交易是:一个项目列表 (消费者一次购买活动中购买的商品) 查找: 所有描述一个项目集合与其他项目集合相关性的规则 E.g., 98% of people who purc

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档