- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DataMining在信用卡客户分群之应用-辅仁大学
Data Mining在信用卡客戶分群之應用 Ben-Ben Bank Data Mining的意義 Data Mining是指找尋隱藏在資料中的訊息,如趨勢(Trend)、特徵(Pattern)及相關性(Relationship)的過程,也就是從大量資料中發掘資訊或知識 Data Mining的功能 分類(classification) 預測(predication) 關聯分組(affinity grouping) 同質分組(clustering) Data Mining的相關技術 記憶基礎推理法(Memory-Based easoning) 市場購物籃分析(Market Basket Analysis) 決策樹(Decision Trees) 基因演算法(Genetic Algorithm) 群集偵測技術(Cluster Detection) 連結分析(Link Analysis) 線上分析處理(On-Line Analytic Processing ; OLAP) 類神經網路(Neural Networks) 區別分析(Discriminant Analysis) 羅吉斯迴歸分析(Logistic Analysis) 研究工具 Data Mining軟體STATISTICA簡介 Data Mining和一般統計分析不同之處在於Data Mining可以處理多個變數的大量資料 Data Mining和統計分析比較 研究架構及步驟 Data Mining流程圖 研究結果 Total次數分配表 Sample次數分配表 群集分析 判別分析 各群特性 第一群 信用卡1~2張 很少用信用卡 一年內有申請的意願 年齡層為15~24歲與30~34歲為主 未婚族群 個人收入20000元 且20001~40000元最多 平均月開銷在20001~40000元 刷卡金額有28.02%的人在60001~80000元 職業以農、林、漁、牧業為最多 其次分別為事務職與銷售職 各群特性 第二群 逾期超過30天佔10.81% 呆帳記錄佔9.86% 借款餘額800萬佔12.40% 退票紀錄佔10.82% 拒往記錄佔10.82% 強制停卡記錄佔11.77% 信用卡2~3張 偶爾使用信用卡 一年內有申請的意願 年齡層為25~39歲與45~54歲為主 已婚族群 個人收入20000元 且20001~40000元最多 平均月開銷在2000元以下,而其中有56.87%沒有收入 刷卡金額有41.73%的人在40001~60000元 職業以高中職學生為最多 男性的差異明顯高於女性 各群特性 第三群 信用卡3~4張 很少用信用卡 一年內有申請的意願 年齡層為35~49歲為主 未婚族群 個人收入20000元 且其中有63.05%沒有收入 平均月開銷在10001~20000元 刷卡金額有49.28%的人在60001~80000元 職業以高中職佔48.27%為最多 結論 第一群:高利潤 第二群:高風險 第三群:高利潤 建議 在我們的進行過程中,發現必須要有一台等級較好的電腦 由於我們所學的有限,有些分析的方法並未能達成。 ~THE END~THANKS * 輔仁大學統計資訊學系 蔡欣蕙 陳飛宏 鄭建德 林函穎 楊宇微 謝邦昌 分析結果 實際資料挖掘工作 (1)集群分析 (2)判別分析 (3)交叉分析 (4)決策樹分析 (5)邏吉斯迴歸分析 (6)類神經網路分析 整理及清理資料 資料轉檔 收集相關的文獻探討 研究動機與目的 測試與檢核 將原來的資(2109518)切割成三大部分: Training Data (1000070) Testing Data (555814) New Data (555814) Training Data Testing Data 隨機抽出0.2%樣本 Sample Training Data (2054) Sample Testing Data (1125) S Training Data S Testing Data 群集分析 分群變數 依群集資料所做出的結果進行判別分析 將分群變數與原來的變數產生合併資料集 將合併後的資料集作交叉分析.羅吉斯回歸.決策樹…. 將Training Data(1000070) 及Testing Data(555814) 依照一定的比例進行抽樣, 做集群分析 將Training Data
文档评论(0)