商業智慧與資料探勘.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
商業智慧與資料探勘

範例資料 (A) →1 80% (B) →2 40% (E) →3 60% (G) →4 80% (E,G) →5 60% (H) →6 40% (J) →7 60% 顧客 代號表示 1 1,2 2 1,(3,4,5),6,7 3 1,4 4 1,(3,4,5),2,6,6,7 5 2,6,7 支持率≧35% 次序相關分析(一) 利用large k-sequence 來產生large(k+1) sequence =7 ╳ 6= 42 ,其中支持率≧35%計有 1,2 2,5 3,5 4,5 5,7 1,3 2,6 3,7 4,7 1,4 2,7 1,5 1,6 1,7 40% L2 次序相關分析(二) 再從其中選擇二個前(k-1)sequence相同之k sequence結合成(K+1)sequence 且任一子k sequence 並且出現在large set ,則(k+1)sequence不能成立 次序相關分析(三) 1 , 2 , 5 1 , 2 , 7 1 , 3 , 5 1 , 3 , 7 1 , 4 , 5 1 , 4 , 7 1 , 5 , 7 2 , 5 , 7 3 , 5 , 7 4 , 5 , 7 40% L3 次序相關分析(四) 1 , 2 , 5, 7 1 , 3 , 5, 7 1 , 4 , 5, 7 40% L4 次序相關分析之結果確認 最大化確定 1.聯集所有large set L2 U L3 U L4 2.還原編號 3.從最大長度開始,針對每個K sequence,刪除其子次序 4.反覆上步驟,直到k=2為止 最後結果只剩 1,4,5,7 即 (30) (40 70) (80) (100) 及1,6 即 (30) (90) 商業智慧與資料探勘 資料探勘的基本觀念 企業的焦點已從以往的資料整理與蒐集,轉變成如何有效的利用資料庫來進行資訊的獲取。 資料探勘就是放棄以往透過人類分析師主觀解讀的方式,而讓資料、數字自己說話,來呈現出最真實的一面 資料探勘的演進 1800年統計學的萌芽 1970年代專家系統及樣式識別(PR)理論的提出及系統實作 1980年歸納法則式的機器學習理論及關聯式資料庫的發展 1990年管理資訊系統(MIS)、及決策支援系統(DSS)陸續受到重視,專家學者開始探討如何有效地從資料庫中進行知識萃取(KDD) 1995年資料探勘名詞的出現 資料探勘的成功案例 IBM公司的Advanced Scout系統,自動分析NBA敵我球隊及球員的數據,以協助教練作出最佳化的戰術組合 加州理工學院噴氣推進實驗室與天文學家合作開發的SKICAT系統,成功幫助天文科學家發現遙遠的星體 芬蘭赫爾辛基大學計算機科學系研發的TASA,則可預測網路通信中的異常現象等等 資料探勘的程序 一.決定企業探勘資料的目的 二.相關領域知識的瞭解 三.資料收集與整合 四.使用適當的資料探勘技術 五.結果分析 六.知識應用 資料探勘的前置步驟 形成資料倉儲(Data Warehousing) 資料選取 資料清理(cleaning) 資料精簡和轉換 資料探勘的技術 1.資料方塊(Data Cube) 2.分類分析(Classification) 3.群集分析(Clustering Analysis) 4.聯結(關連)分析(Association Rule Analysis) 5.序列樣式相關分析(Sequential Pattern Analysis) 6.鏈結分析(Link Analysis) 7.時間序列相似性分析(Time Series Similarity Analysis) 維繫客戶關係避免客戶流失 穩定流動性高的客戶 定義/預測流動性高的客戶 分類分析 群集分析 聯結分析 次序相關分析 資料探勘技術 交叉行銷 新產品與市場開發 產品合售 產品創新 資料探勘任務 企業策略 企業問題 資料方塊(一) 表 14-1 客戶代號 負債狀況 信用歷史紀錄 抵押品 月薪 風險程度 1 高 壞 無 2萬以下 高 2 高 未知 無 2-4萬 高 3 低 未知 無 2-4萬 中等 4 低 未知 無 2萬以下 高 5 低 未知 無 超過4萬 低 6 低 未知 適當 超過4萬 低 7 低 壞 無 2萬以下 高 8 低 壞 適當 超過4萬 中等 9 低 好 無 超過4萬 低 10 高 好 適當 超過4萬 低 11 高 好 無 2萬以下 高 12 高 好 無 2-4萬 中等 13 高 好 無 超過

文档评论(0)

daoqqzhuan2 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档