- 291
- 0
- 约1.39千字
- 约 26页
- 2019-06-30 发布于安徽
- 举报
聚类分析
简要介绍
聚类分析是研究如何将样品或变量进行分类的一种方法(将一些观察对象依据某些微量特征加以归类)。主要应用于探索性的研究,其分析的结果可以提供多个可能的解,选择最终的解需要研究者的主观判断和后续的分析。
分类:
系统聚类:用于对小样本的样品间聚类以及对变量聚类。
动态聚类:适用于样本量较大时样品间的聚类,常用k-means法处理。
有序样品聚类:对有排列次序的样本的样品间聚类,要求必须是次序相邻的样品才能聚成一类。
房价问题
2004年全国37大城市国民经济和社会发展统计公报的相关数据
分别从国内生产总值(GDP)、
居民家庭人均可、支配收入、房价收入比、人均GDP这四个维度对全国
37大城市的房价问题进行聚类分析
房价收入比
房价收入比:是指居住单元的中等自由市场价格与中等家庭年收入之比。
例如一套售价为49万元的房子对于一个年收入7万元的家庭,其比值便为7:1
-
消费群体
聚类分析在银行客户细分领域中的应用:
所用变量:
序号
变量
1
客户年龄
2
发卡日期
3
支付宝交易金额
4
贷款数量
5
一段时间内的交易次数
6
一段时间内交易最大金额
7
一段时间内平均交易金额
8
一段时间内交易后余额
特征向量
客户年龄
发卡日期
支付宝交易金额
贷款数量
一段时间内的交易次数
一段时间内交易最大金额
一
原创力文档

文档评论(0)