行业名家讲座 201706王彦博:从互联网金融到大数据金融(2017银行国赛分论坛) 从互联网金融到大数据金融-王彦博4.pptxVIP

行业名家讲座 201706王彦博:从互联网金融到大数据金融(2017银行国赛分论坛) 从互联网金融到大数据金融-王彦博4.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从互联网金融到大数据金融(四)主讲教师:王彦博3.2 银行对公客户流失预测大数据挖掘15.63%经测算,全行每季度一般性存款季日均下降55%的流失客户约为5.5万户,每季度流失存款季日均约420亿元,户均流失存款约76万元。按模型计算,每季度可少流失客户超过1.5个百分点,减少存款季日均流失1.60~6.96亿元,自流失预测模型应用部署以来,5个季度累计挽回存款季日均22.04亿元。3.3 银行客户评价文本挖掘非结构性文本数据已成为大数据主流IBM《大数据时代,重新定义非结构化数据》报告指出:维基百科,关于文本挖掘的解释:“由于目前的大多数信息(80%)是以文本的形式来保存,文本挖掘被认为具有较高的商业潜在价值”。“目前,非结构化数据的内容占据了当前数据海洋的80%”。IDC(国际数据公司)调查显示:“今后十年,非结构化数据将占互联网总数据的90%”。3.3 银行客户评价文本挖掘 在商业银行日常经营管理过程中,经常会产生大量非结构性文本数据,例如:客户投诉、舆情动态、审计报告、公文签报、制度发文、员工简历、员工之声、工作周报、会议纪要等。如何对这些文本数据进行分析挖掘,从中提炼出有价值的信息并加以有效应用,已经成为大数据时代下商业银行需要解决的一项重要课题。经过一段时间的积累,银行往往需要对所收集的文本信息按主题进行归纳提炼以客户对银行的评价信息为例,首先明确分析挖掘的主题是针对“好评”、“差评”还是“咨询”或“建议”,以及分析对象的范围(比如针对某家银行或某几家银行),同时要明确时间范围(比如最近一年、近三年、历史过往)等要素明确主题,例如:关于全国性股份制商业银行的客户好评文本分析需要回答的几个问题:(1)银行赢得客户好评的因素有哪些?(2)银行赢得客户好评最多的几类因素是什么?(3)各项因素在全部客户好评中的占比是多少?(4)相关分析工作如何指导银行实现管理提升?3.3 银行客户评价文本挖掘 在商业银行日常经营管理过程中,经常会产生大量非结构性文本数据,例如:客户投诉、舆情动态、审计报告、公文签报、制度发文、工作周报、会议纪要等。如何对这些文本数据进行分析挖掘,从中提炼出有价值的信息并加以有效应用,已经成为大数据时代下商业银行需要解决的一项重要课题。关于全国性股份制商业银行的客户好评文本分析【主题】银行赢得客户好评的因素有哪些? 【关键词】银行赢得客户好评最多的几类因素是什么? 【类别】各项因素在全部客户好评中的占比是多少? 【样本】相关分析工作如何指导银行实现管理提升? 【应用】通过构建“半监督”文本聚类技术,对文本主题、类别、关键词和样本之间的关系进行学习,从而实现对非结构性信息的结构化转换和提炼,相关应用对商业银行经营管理提升起到积极推动作用。3.3 银行客户评价文本挖掘半监督学习 半监督学习是数据挖掘、模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。它主要考虑如何利用少量的标注样本和大量的未标注样本进行分类/聚类的问题。3.3 银行客户评价文本挖掘半监督文本学习半监督分类与半监督聚类 半监督聚类利用少量的标记数据辅助聚类算法的实现,以提高聚类算法的精度。半监督聚类算法很多是在传统聚类算法基础上引入监督信息。 半监督分类利用少量已标记样本及其类别信息和未标记样本的数据分布信息建立一个分类模型,并利用此模型对未知样本数据进行类别判定。类 别 1类 别 2 然而,在很多实际的文本挖掘问题中,我们甚至对于那些少量标记的样本也只能部分获取标签信息(标签是由某一个或某几个关键词形成的概念),单个标签有可能随着逐步完善的关键词体系进而完善;标签(类别)体系也会随之逐步完善。类 别 3类 别 43.3 银行客户评价文本挖掘算法演示Local Support 0.5 ; Lift = Local Support / Global Support 1.5Global Support类 12 , 0.293 , 0.43AABB3 , 0.431 , 0.50, 1.752 , 1.00, 1.751 , 0.50, 1.174 , 0.571 , 0.50, 0.88CED2 , 0.29类 22 , 0.292 , 0.29GFGDF4 , 0.573 , 1.00, 1.751 , 0.33, 1.142 , 0.67, 2.351 , 0.33, 1.14第一轮结束3.3 银行客户评价文本挖掘算法演示Local Support 0.5 ; Lift = Local Support / Global Support 1.5Global Support类 12 , 0.293 , 0.43AACBBE3 , 0.431 , 0.25, 0.881 , 0.25, 0.

文档评论(0)

WanDocx + 关注
实名认证
文档贡献者

大部分文档都有全套资料,如需打包优惠下载,请留言联系。 所有资料均来源于互联网公开下载资源,如有侵权,请联系管理员及时删除。

1亿VIP精品文档

相关文档