DataMining在信用卡客户分群的应用.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Data Mining在信用卡客戶分群之應用蔡欣蕙、陳飛宏、鄭建德、林函穎、 楊宇微謝邦昌輔仁大學統計資訊學系總裁台灣區經理鄭建德行銷主任楊宇微資訊人員陳飛宏專員蔡欣蕙專員林函穎Ben-Ben Bank會議進行中………Data Mining的意義 Data Mining是指找尋隱藏在資料中的訊息,如趨勢(Trend)、特徵(Pattern)及相關性(Relationship)的過程,也就是從大量資料中發掘資訊或知識。Data Mining的功能分類(classification)推估(estimation) 預測(predication) 關聯分組(affinity grouping) 同質分組(clustering)Data Mining的相關技術記憶基礎推理法(Memory-Based easoning)市場購物籃分析(Market Basket Analysis) 決策樹(Decision Trees) 基因演算法(Genetic Algorithm) 群集偵測技術(Cluster Detection) 連結分析(Link Analysis) 線上分析處理(On-Line Analytic Processing ; OLAP)類神經網路(Neural Networks) 區別分析(Discriminant Analysis) 羅吉斯迴歸分析(Logistic Analysis) Data Mining和統計分析比較Data Mining和一般統計分析不同之處在於Data Mining可以處理多個維度的大量資料,避免了下面幾點困難:巨量的紀錄、高維的資料、蒐集到的資料僅有一小部分用來分析。研究工具Data Mining軟體—STATISTICA 6.0基於經費的考量,已取得軟體的使用授權。研究架構及步驟收集相關的文獻探討實際資料挖掘工作(1)集群分析(2)判別分析(3)交叉分析(4)決策樹分析(5)羅吉斯迴歸分析(6)類神經網路分析測試與檢核分析結果研究動機與目的整理及清理資料資料轉檔Data Mining流程圖將原來的資料(2,109,518筆)切割成三大部分:Training Data (1,000,070筆) Testing Data (555,814筆) New Data (553,634筆)Training Data Testing Data隨機抽出0.2%樣本Sample Training Data (2054筆)Sample Testing Data (1125筆) S Training Data S Testing Data 做群集分析產生分群變數依分群變數資料集結果進行判別分析將分群變數與原來的變數產生合併資料集 將合併後的資料集作交叉分析.羅吉斯迴歸.決策樹….將Training Data(1,000,070筆) 及Testing Data(555,814筆)直接做群集分析將Training Data及Testing Data作群集分析產生分群變數資料集將分群變數的資料集作判別分析 將分群變數與原來的變數產生合併資料集將合併後的資料集作交叉分析.羅吉斯回歸.決策樹….Data Mining抽樣流程Data Mining(未經抽樣)流程 Data Mining(未經抽樣+抽樣流程圖)研究結果樣本與母體結構比較分群結果判別結果瑕疵戶預測結果分群特性群集結果分群個數判別結果判別結果誤判率瑕疵戶預測模型結果 Y:是否為瑕疵戶 X:是否逾期超過30天 是否有呆帳紀錄 是否有借款餘額800萬 是否有退票紀錄 是否有拒往紀錄 是否有他行強制停卡紀錄 對不同顧客如何處理黃金單身漢農林漁牧(16.55%)事務職(12.21%)銷售業(11.18%)一年內有申請的意願 (30.3%)信用卡張數2~3張 (55.86%)很少使用信用卡 (18.92%)15~24歲(34.23%)30~34歲(15.08%)未婚(49.76%)上,中上(76.78%)個人月收入20,000元(100%)20,001~40,000元佔(73.59%)平均月開銷20,001~40,000元(15.46%) 家庭月收入60,000元以下(100%)刷卡金額60,001~80,000元(28.02%)銀行殺手大學生(8.18%)專科學生(8.25%)高中職學生(18.99%)逾期30天(10.81%) 呆帳紀錄(9.86%)借款餘額800萬(12.40%) 退票紀錄(10.82%)拒往紀錄(11.10%)強制停卡紀錄(11.77%)經常使用信用卡(34.33%)偶爾使用信用卡(45.98%)個人月收入20,000元以下,其中沒有收入佔(56.87%)平均月開銷20,000元以下(84.69%)家庭月收入60,

文档评论(0)

职教魏老师 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档