国立联合大学资讯管理学系资料探勘课程.ppt

国立联合大学资讯管理学系资料探勘课程.ppt

国立联合大学资讯管理学系资料探勘课程

Data Mining: Concepts and Techniques Course 3 挖掘關聯式規則 Mining Association Rules ? Outlines 關聯分析的基本概念與準則 (Basic Concepts and Road Map) 有效率且可行的頻繁項目集挖掘方法 (Efficient and scalable frequent itemset mining methods) 挖掘多樣化的關聯規則 (Mining various kinds of association rules) 從關聯挖掘到相關性分析 (From association mining to correlation analysis) 具有限制的關聯挖掘 (Constraint-based association mining) Summary ? Basic Concepts and a Road Map Frequent pattern: a pattern (a set of items, subsequences, substructures, etc.) that occurs frequently in a data set Motivation: Finding inherent regularities in data What products were often purchased together?— Beer and diapers?! What are the subsequent purchases after buying a PC? What kinds of DNA are sensitive to this new drug? Can we automatically classify web documents? “尿布與啤酒”──典型關聯分析案例 在美國,一些年輕的父親下班後經常要到超市去買嬰兒尿布,超市也因此發現了一個規律,在購買嬰兒尿布的年輕父親們中,有30%~40%的人同時要買一些啤酒。超市隨後調整了貨架的擺放,把尿布和啤酒放在一起,明顯增加了銷售額。 同樣的,我們還可以根據關聯規則在商品銷售方面做各種促銷活動。 Applications Basket data analysis, cross-marketing, sale campaign analysis, and DNA sequence analysis. 如果問題的全域是商店中所有商品的集合,則對每種商品都可以用一個布林量來表示該商品是否被顧客購買,則每個購物籃都可以用一個布林向量表示;而透過分析布林向量則可以得到商品被頻繁關聯或被同時購買的模式,這些模式就可以用關聯規則表示。 (0001001100,這種方法失去了什麼訊息?) What Is Association Mining? Association rule mining: Finding frequent patterns, associations, correlations, or causal structures among sets of items or objects in transaction databases, relational databases, and other information repositories. Examples. Rule form: “Body ? Head [support, confidence]”. buys(x, “diapers”) ? buys(x, “beers”) [0.5%, 60%] major(x, “CS”) ^ takes(x, “DB”) ? grade(x, “A”) [1%, 75%] 給定︰ Items set: I={i1,i2,...,im} The task-relevant data D: 是資料庫交易的集合,每個交易T則是項目的集合,使得 每個交易由交易識別符號TID標識; A, B為兩個項目集合,交易T包含A if and only if 關聯規則是如下蘊涵式︰ 其中 並且 ,規則 在資料集D中成立,並且具有支持度s和置信度c 範例 項目集合 I={A,B,C,D,E,F} 每個交易T由交易識別符號TID標識,它是項目集合 比如︰TID(2000)={A,B,C} 任務相關資料D是資料庫交易的集合 Terminologies Item I1, I2, I3, … A, B, C, … Itemset {I1}, {I1, I7}, {I2, I3

文档评论(0)

1亿VIP精品文档

相关文档