次序相关分析.PPT

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
次序相关分析

範例資料 (A) →1 80% (B) →2 40% (E) →3 60% (G) →4 80% (E,G) →5 60% (H) →6 40% (J) →7 60% 顧客 代號表示 1 1,2 2 1,(3,4,5),6,7 3 1,4 4 1,(3,4,5),2,6,6,7 5 2,6,7 支持率≧35% 次序相關分析(一) 利用large k-sequence 來產生large(k+1) sequence =7 ╳ 6= 42 ,其中支持率≧35%計有 1,2 2,5 3,5 4,5 5,7 1,3 2,6 3,7 4,7 1,4 2,7 1,5 1,6 1,7 40% L2 次序相關分析(二) 再從其中選擇二個前(k-1)sequence相同之k sequence結合成(K+1)sequence 且任一子k sequence 並且出現在large set ,則(k+1)sequence不能成立 次序相關分析(三) 1 , 2 , 5 1 , 2 , 7 1 , 3 , 5 1 , 3 , 7 1 , 4 , 5 1 , 4 , 7 1 , 5 , 7 2 , 5 , 7 3 , 5 , 7 4 , 5 , 7 40% L3 次序相關分析(四) 1 , 2 , 5, 7 1 , 3 , 5, 7 1 , 4 , 5, 7 40% L4 次序相關分析之結果確認 最大化確定 1.聯集所有large set L2 U L3 U L4 2.還原編號 3.從最大長度開始,針對每個K sequence,刪除其子次序 4.反覆上步驟,直到k=2為止 最後結果只剩 1,4,5,7 即 (30) (40 70) (80) (100) 及1,6 即 (30) (90) 商業智慧與資料探勘 資料探勘的基本觀念 企業的焦點已從以往的資料整理與蒐集,轉變成如何有效的利用資料庫來進行資訊的獲取。 資料探勘就是放棄以往透過人類分析師主觀解讀的方式,而讓資料、數字自己說話,來呈現出最真實的一面 資料探勘的演進 1800年統計學的萌芽 1970年代專家系統及樣式識別(PR)理論的提出及系統實作 1980年歸納法則式的機器學習理論及關聯式資料庫的發展 1990年管理資訊系統(MIS)、及決策支援系統(DSS)陸續受到重視,專家學者開始探討如何有效地從資料庫中進行知識萃取(KDD) 1995年資料探勘名詞的出現 資料探勘的成功案例 IBM公司的Advanced Scout系統,自動分析NBA敵我球隊及球員的數據,以協助教練作出最佳化的戰術組合 加州理工學院噴氣推進實驗室與天文學家合作開發的SKICAT系統,成功幫助天文科學家發現遙遠的星體 芬蘭赫爾辛基大學計算機科學系研發的TASA,則可預測網路通信中的異常現象等等 資料探勘的程序 一.決定企業探勘資料的目的 二.相關領域知識的瞭解 三.資料收集與整合 四.使用適當的資料探勘技術 五.結果分析 六.知識應用 資料探勘的前置步驟 形成資料倉儲(Data Warehousing) 資料選取 資料清理(cleaning) 資料精簡和轉換 資料探勘的技術 1.資料方塊(Data Cube) 2.分類分析(Classification) 3.群集分析(Clustering Analysis) 4.聯結(關連)分析(Association Rule Analysis) 5.序列樣式相關分析(Sequential Pattern Analysis) 6.鏈結分析(Link Analysis) 7.時間序列相似性分析(Time Series Similarity Analysis) 維繫客戶關係避免客戶流失 穩定流動性高的客戶 定義/預測流動性高的客戶 分類分析 群集分析 聯結分析 次序相關分析 資料探勘技術 交叉行銷 新產品與市場開發 產品合售 產品創新 資料探勘任務 企業策略 企業問題 資料方塊(一) 表 14-1 客戶代號 負債狀況 信用歷史紀錄 抵押品 月薪 風險程度 1 高 壞 無 2萬以下 高 2 高 未知 無 2-4萬 高 3 低 未知 無 2-4萬 中等 4 低 未知 無 2萬以下 高 5 低 未知 無 超過4萬 低 6 低 未知 適當 超過4萬 低 7 低 壞 無 2萬以下 高 8 低 壞 適當 超過4萬 中等 9 低 好 無 超過4萬 低 10 高 好 適當 超過4萬 低 11 高 好 無 2萬以下 高 12 高 好 無 2-4萬 中等 13 高 好 無 超過

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档