- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
H13-731V2R1V2R1王清亮/wwx6557492018.11.11新开发
第十二章大数据挖掘
本章通过对银行客户精准画像、提升信用卡安全和城市环境质量分析挖掘三个案例的解析,加深对数据挖掘理论的理解,并对其在商业上的应用有一定的认识。
学完本课程后,您将能够:了解数据挖掘的背景。了解数据挖掘在金融业的应用。了解数据挖掘在城市环境监测中的应用。
数据挖掘背景银行客户精准画像案例提升信用卡安全案例城市环境质量分析挖掘案例
数据挖掘背景(1)在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程。主要基于人工智能,机器学习,模式学习,统计学等,通过对大数据高度自动化地分析,做出归纳性的推理,从中挖掘出潜在的模式,可以帮助企业、商家、用户调整市场政策、减少风险、理性面对市场,并做出正确的决策。目前,在很多领域尤其是在商业领域如银行、电信、电商等,数据挖掘可以解决很多问题,包括市场营销策略制定、背景分析、企业风险规避等。
数据挖掘背景(2)数据挖掘已经成为各企业从浩如烟海的数据中提取有用信息、赢得竞争胜利的重要武器。通过数据挖掘可以建立起企业整体或某个业务过程局部的不同类型的模型。可以描述企业当前发展的现状和规律。可以用来预测当条件发生变化后可能的状况。能为企业开发新的产品或服务。能为企业机构的重组提供决策支持依据。
数据挖掘背景银行客户精准画像案例提升信用卡安全案例城市环境质量分析挖掘案例?
银行客户精准画像案例(1)商业理解:金融业的竞争日趋激烈,越来越多的银行和金融机构意识到客户才是他们真正的资产,围绕保留现有客户和发展新客户的工作也越来越多的展开,营销方式也从大众化营销转向差异化、一对一营销,这种转变的关键就是有效的客户画像的构建。通过数据挖掘的方法对既有客户进行精准画像的建设,更透彻地理解客户的行为、特征,以发现新的商业机会,减少对既有客户的营销成本,进行产品的交叉销售和提升销售,同时做好高价值客户的管理。
银行客户精准画像案例(2)算法选择:在客户分类问题中采用的主要是数据挖掘中分类和聚类的算法。在本案例中我们采用聚类的算法。聚类分析的主要思想是认为研究的数据集中的数据才在不同程度的相似性,根据数据的几个属性找到能够度量它们之间的相似程度的量,把一些相似程度较大的归为一类,另一些相似程度较大的归为另一类。聚类是无指导学习,事先我们不知道要分几类,它是将没有类标志的数据聚集成有意义的类。类中相似的对象集合,没有通用的严格的定义,一般通过限制元素间的距离来定义类。
银行客户精准画像案例(3)数据理解和数据准备:银行要建立客户的分类,主要解决的问题之一是如何把有相似产品交易行为的客户归为一组,发现客户中有多少组不同的行为群体。数据集成,数据来自数据仓库中多个数据表,经过了数据采集、清理和集成,生成一个针对数据挖掘目标确定与交易行为有关的数据项集合,例如,总交易笔数、保险购买金额、保险购买次数、基金购买金额、基金购买次数、转账次数、转账金额等。数据转换,为了确保各变量在分析中的地位相同,可以对数据进行变换,中心化和标准化变换。经过一系列的变换后,各属性的均值为1,标准差为0,即各属性基点相同且变化范围也统一。
银行客户精准画像案例(4)数据建模:从最近三个月的原始交易数据计算获得变量,并整合在客户的实际交易情况上定义客户的行为,每个客户作为一条观测。从中随机抽取2867个客户作为研究实例的代表性样本。在聚类算法中,K-Means算法在实践中越来越成熟,也取得了很好的效果,在本实例中首先取K=2,3,4,5,…,10进行实验,结果取K=5最符合实际情况。最终确定聚类个数为5,并对经过数据变换的数据进行聚类划分。该算法的输入为,聚类个数K=5,包含2867个数据对象的数据集。输出为,满足方差最小标准的K个聚类。
银行客户精准画像案例(5)模型评估:经过数据挖掘聚类后,将实例数据集中的数据对象分为5类,为了方便分析,将数据库汇总没类具体属性值统计后制表如下。聚类号12345客户数316530928352741客户比例11.02%18.49%32.37%12.28%28.84%总交易笔数18572842114896624996购买保险次数785435126114525购买保险金额(元)7464738.2256333134157.55342.8购买基金次数532108647712098购买基金金额(元)5782627.536413123.625327271.964272.715823.5转账次数32231727599转账金额(元)1545563.83494542115
原创力文档


文档评论(0)