- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
關聯規則判斷標準
Microsoft SQL Server 2005 Data Mining 演算法 – Association 謝邦昌 輔仁大學統計資訊學系 教授中華資料採礦協會? 理事長 Association Rule關聯規則分析 關聯規則的分類與作用 關聯規則的分類與作用 關聯規則判斷標準 關聯規則判斷標準 關聯規則判斷標準 關聯規則判斷標準 關聯規則判斷標準 關聯規則判斷標準 關聯規則判斷標準 關聯規則判斷標準 關聯規則判斷標準 什麼是關聯分析? 關聯規則分析: 在交易資料、關係資料或其他資訊中,查找存在于專案集合或物件集合之間的頻繁模式、關聯、相關性、或因果結構。 應用: 購物籃分析、交叉銷售、產品目錄設計、 loss-leader analysis、聚集、分類等。 舉例: 規則形式:“Body? Head [support, confidence]”. buys(x,diapers”)?buys(x,“beers”) [0.5%, 60%] major(x,”CS”) ^ takes(x,”DB”)?grade(x,“A”) [1%, 75%] 關聯規則:基本概念 給定: (1)交易資料庫 (2)每筆交易是:一個項目列表 (消費者一次購買活動中購買的商品) 查找:所有描述一個專案集合與其他專案集合相關性的規則 E.g.,98% 的顧客買輪胎及汽車自動設備他會接受自動化服務的機會相當高 應用 *? 理用品(商店應該怎樣提高護理用品的銷售?) 家用電器 ?*(其他商品的庫存有什麼影響?) 在產品直銷中使用附加郵寄 規則度量:支持度與可信度 查找所有的規則X Y? Z具有最小支援度和可信度 支持度, S, 一次交易中包含{X 、 Y 、 Z}的可能性 可信度, C,包含{X 、 Y}的交易中也包含Z的條件概率 如何測量Support and Confidence For rule A ? C support = support({A, C}) = 50% confidence = support({A, C})/support({A}) = 66.6% Market Basket Analysis Rule Explain: Support and Confidence Minimum Support and Confidence Let minimum support 50%, and minimum confidence 50%, we have A ? C [50%, 66.6%] C ? A [50%, 100%] Analysis The number of itemsets of a given cardinality tends to grow exponentially Terminologies Item I1, I2, I3, … A, B, C, … Itemset {I1}, {I1, I7}, {I2, I3, I5}, … {A}, {A, G}, {B, C, E}, … 1-Itemset {I1}, {I2}, {A}, … 2-Itemset {I1, I7}, {I3, I5}, {A, G}, … Example Apriori Algorithm Apriori Algorithm Apriori Algorithm Another Example 1 關聯規則分析:路線圖 布林 vs. 定量關聯(基於處理資料的類型) buys(x, “SQLServer”) ^ buys(x, “DMBook”) ? buys(x, “DBMiner”) [0.2%, 60%] age(x, “30..39”) ^ income(x, “42..48K”) ? buys(x, “PC”) [1%, 75%] 單維 vs. 多維關聯(例子同上) 單層 vs. 多層分析 那個品種牌子的啤酒與那個牌子的尿布有關係? 各種擴展 相關性、因果分析 關聯並不一定意味著相關或因果 最大模式和閉合相集 添加約束 如, 哪些“小東西”的銷售促使了“大傢伙”的買賣? 關聯規則分析—一個例子 對於A ? C: support = support({A、C}) = 50% confidence = support({A、C})/support({A}) = 66.6% Apriori的基本思想: 頻繁項集的任何子集也一定是頻繁的 Apriori演算法 連接:用 Lk-1自連接得到Ck 修剪:一個k-項集,如果他的一個k-1項集(他的子集 )不是頻繁的,那他本身也不可能是頻繁的。 偽代碼: Ck: Candidate itemset of size k Lk: frequent itemset o
文档评论(0)