银行客户满意度分析论文.docVIP

  • 11
  • 0
  • 约 16页
  • 2017-02-08 发布于重庆
  • 举报
银行客户满意度分析论文

浙江大学宁波理工学院 综合评定成绩: 评委评语: 评委签名: 银行服务客户满意度分析 摘要: 随着全球银行业市场竞争的日趋激烈,提升客户的满意度,培养忠诚客户已成为各大商业银行开拓市场,增加盈利的重要手段之一。通过数据挖掘技术对客户满意度进行分析已成为研究热点。 桑坦德银行(Santander Bank)是欧洲第二大银行,他们提供了一个数据集要求通过数据挖掘技术在早期就能识别对其服务不满意的客户,以便及时采取合适的改进措施以提升客户的体验。 关键词: 数据挖掘技术分析法 The thesis title Abstract: A brief description of the abstract Key words: The keyword extraction 目 录 1. 研究目标 6 2. 分析方法与过程 6 2.1. 总体流程 6 2.2. 具体步骤 6 2.3. 结果分析 7 3. 结论 7 4. 参考文献 7 挖掘目标 (1) 随着全球银行业市场竞争的日趋激烈,提升客户的满意度,培养忠诚客户已成为各大商业银行开拓市场,增加盈利的重要手段之一。通过数据挖掘技术对客户满意度进行分析已成为研究热点。 桑坦德银行(Santander Bank)是欧洲第二大银行,他们提供了一个数据集要求通过数据挖掘技术在早期就能识别对其服务不满意的客户,以便及时采取合适的改进措施以提升客户的体验。在本次竞赛中,参赛者需要通过分析匿名用户的上百个特征来预测用户对其银行服务的满意程度(满意或不满意)。在数据集中ID表示客户的匿名ID,TARGET是需要预测的变量,1表示不满意,0表示满意,剩余的列是已提取的跟客户满意度相关的观测指标(属性); 需求: 2、 3、; 4、 说明: ample_submission.csv是需要与源代码一起上传的最后结果样式,要求输出对Test.csv的测试结果。 (2) 本次数据挖掘建模要达到的目标是利用银行关于客户信息建立下来的数据,采用数据挖掘技术,进行已知数据结果的相关测试规律建立模型,测试数据模型进行预测得到你。 给出的大的以及都比较大,会有一些和无效数据首先要,ka的元学习器与NativeBayes一起使用,测试软件的属性选择方法得到一些最具影响力的属性进行训练子集,并且运用进算法里面。方法可以和人属性一起算法的找到不同比较合理的随后的模型预测 分析方法与过程 总体流程 2.1.1 问题 2.1.2 问题、、 具体步骤 2.2.1 解问题 将excel数据进行转化得weka可以识别的csv格式,利用weka的另存功能得到arff格式,这个过程得到的数据还是不能直接进入决策树运用的。需要打开arff格式的数据,将数据类别的一栏修改为银行需要的、满意度类别,将数据加载计入决策树可以得到一个枝节繁茂的树,由此可以从这棵树的模型之中得到影响因素中最大的为根节点以及靠近根节点的几个特征。 使用wake通过决策树48算法 ,验证训练集,结果如图: 图2 2.2.2 解问题、、 本用例主要包括如下步骤: 步骤:数据筛选数据预处理 从原始数据分析得到,题目给出的原始数据属性太多,并且都是未知属性,此外表格的大部门数据值为,面对这个训练集,里面特征很多是和类标签有关的,但里面存在噪声或者冗余。在这种情况下,需要一种特征降维的方法来减少特征数,减少噪音和冗余,减少过度拟合的可能性。 所以我们weka深入研究自动属性选择,指定属性和学习算法作为分类器的一部分确保选择属性子集仅基于训练数据。 该算法的好处: 准确估计 属性过程中避免了因为的的导致减少后的一部分数据用于过程中,在选择属性中回已经看到了要使用的属性,从而影响模型构建偏倚的准确性估计。 选择 该方法是利用算法,让学习器对数据进行学习选择,提取重要影响因素,这种软件选择得到的数据结果比具有高的。 我们想要利用上面的方法筛选得到需要的,子集总体的影响程度相关性比较大。模型训练起较大作用的数据,从而建立一个更科学的决策树模型,使得这个模型可以应用于测试数据,从而进行相关的结果预测。得到的训练如下 图3 图4 步骤:建模预测 将上面得到的,分类面板,利用 weka 的分类算法——决策树)的的优化方法,设定的阈值为决策树,进行分类处理 该算法的是通过对属性的信息熵的计算,以信息增益量为度量进行划分分裂结点,选取信息增益量最小的作为根节点,下面就重复上面的步骤依次将节点分裂

文档评论(0)

1亿VIP精品文档

相关文档