资料探勘7网路资料库之关连法则内部资料.pptVIP

资料探勘7网路资料库之关连法则内部资料.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
资料探勘7网路资料库之关连法则内部资料

* 關連分析(3) 若correlation 1,表示 A 和 B 是逆相關 (negatively correlated),亦即 A 的出現會造成 B 出現的機率降低。 若correlation 1,表示 A 和 B 是正相關 (positively correlated),亦即 A 的出現會造成 B 出現的機率增高。 若correlation = 1,表示 A 和 B 是無關的。 當相關程度大於 1 時,表示使用法則的效果會比較顯著。但是當相關程度小於 1 時,則表示使用法則的效果可能不佳。 * 內容概要 簡介 關連法則探勘 (Association Rule Mining) 多層次關連法則探勘 (Multilevel Association Rule Mining) 數量化關連法則探勘 (Quantitative Association Rule Mining) 關連分析 (Correlation Analysis) 總結 * 總結 本章內容包括: 基本的關連法則探勘:Apriori演算法 多層次關連法則探勘:使用概念階層的觀念來進行多層次關連法則的探勘 數量化關連法則探勘:考慮物品被購買的數量,進一步發掘物品與購買數量之間的關係 關連分析 相關的研究包括: 使用雜湊 (hash) 或快取 (cache) 等觀念來改進關連法則探勘的效能 考慮顧客屬性和購買物品之間的關係 如何維護所發掘出來的關連法則 * 範例7-7 (3) 層次3 {121*} ? {211*} 信心水準=3/3=1 {211*} ? {121*} 信心水準=3/4=0.75 第1和第2條關連法則皆符合條件。 層次4 {1212} ? {2112} 信心水準=2/2=1 {2112} ? {1212} 信心水準=2/3=0.67 第1和第2條關連法則皆符合條件。 * 範例7-7 (4) 在商品項目的編碼中,假設第一個數字 “1” 代表 “個人電腦”(如圖7-5) ,“2” 代表 “螢幕” (如圖7-14) ,“4” 代表 “印表機” (如圖7-15) 。將符合條件的關連法則根據編碼的方式還原如下: “個人電腦” ? “螢幕” 信心水準=0.875 “螢幕” ? “個人電腦” 信心水準=1 “印表機” ? “個人電腦” 信心水準=1 “CRT螢幕” ? “攜帶型電腦” 信心水準=0.75 “筆記型電腦” ? “17吋CRT螢幕” 信心水準= 1 “17吋CRT螢幕” ? “筆記型電腦” 信心水準= 0.75 “IBM筆記型電腦” ? “宏碁17吋CRT螢幕” 信心水準= 1 “宏碁17吋CRT螢幕” ? “IBM筆記型電腦” 信心水準= 0.67 * 內容概要 簡介 關連法則探勘 (Association Rule Mining) 多層次關連法則探勘 (Multilevel Association Rule Mining) 數量化關連法則探勘 (Quantitative Association Rule Mining) 關連分析 (Correlation Analysis) 總結 * 簡介(1) 物品與購買數量這層關係對於行銷策略的決定有重要的影響。 例如,“40%的顧客如果購買一個碳粉匣,也會購買三包報表紙”。我們稱這種法則為 “數量化關連法則” (quantitative association rule)。 數量化關連法則有助於決策者制定出更有效益的行銷策略。 例如,當考慮 “碳粉匣” 的促銷策略時,就可以根據 探勘結果的資訊,提出類似 “買一個碳粉匣送兩包報表紙” 的促銷方案。 * 簡介(2) 同時考慮 “物品” 與 “購買數量” 時,會造成滿足最小支持度的項目集變得更少,甚至可能無法產生任何滿足最小支持度的關連法則。 考慮將 “數量” 分割成許多區間 (intervals),提高每一個項目在其所屬區間的支持度,以發掘出更多潛在有用的關連法則。 * 相關定義 假設在資料庫中每一筆交易是由一個交易編號以及一組 q_項目 (q_item) 所組成的。 q_項目的形式為 i,q,它代表項目 i 以及被購買的數量 q。 一組q_項目所組成的集合稱之為 q_項目集 (q_itemset)。 一個 q_項目 x 的支持度被定義為“包含q_項目x的交易總數

文档评论(0)

aena45 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档