- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基干KII算法公务卡用户分类模式探讨
基于KII算法的公务卡用户分类模式研究 摘要:本文根据行政企事业单位工作人员办公的特点,借鉴相关银行系统理论与实践,对聚类方法中的经典K-means算法进行了改进,并应用到公务卡用户分类模式中,实现对公务卡用户的价值及行为特征的分类。对KII算法进行了仿真,实验结果表明该算法的准确率等方面较经典K-means算法有所提升。本文阐述了公务卡用户分类时如何选择分类变量、如何进行数据的预处理的全过程,也为银行进行公务卡用户分类提供了方法上的指导
关键词:KII算法 公务卡 用户分类
借鉴国内外相关的理论研究,基于数据挖掘技术的公务卡用户分类研究很多都是基于经典K-means算法进行的,这主要是因为相对大部分聚类算法而言,K-means算法的时空复杂度相对较小,性能相对较好,同时很多挖掘工具都提供了内置的K-means聚类模型,如SPSS Clementine,DB Miner等,可直接使用,非常方便。但由于经典K-means算法本身存在的一些固有缺陷(如参数人为指定,初始聚类中心随机生成等),会影响公务卡用户分类结果的可靠性。因此本文将克服了K-means四大缺陷的算法――启发式初始化的改进K-means算法(KII算法)应用到公务卡用户分类研究中,建立基于KII算法的公务卡用户分类模式
一、公务卡用户分类的维度分析
(一)维度分析的依据
维度是人们观察事物的角度,是有关于目标问题的属性的集合。在不同的应用背景和应用目的下,维度的选择和构成也不同。在公务卡用户分类问题中,银行分类的主要目的是识别用户的行为特征,尤其是用户中高价值用户的特征,以便对具有相似行为特征的高价值用户群开展集中的针对性营销和服务,因此用户的价值特征以及行为特征对银行而言都是非常感兴趣的模式,都可以作为公务卡用户分类的维度。对于用户的基本特征以及账户特征,由于它们能够对公务卡用户的价值及行为特征产生影响,因而银行对这类特征也很关心,所以它们也应该列为公务卡用户分类的维度。因此下文将从个人基本特征、用户持卡行为、用户价值、用户账户特征四个维度进行综合分析,建立一个完整的用户分类指标体系,以提供用户分类变量的选取范围。当分类指标体系确定后,可根据挖掘目标的需要,选取合适的分类变量
(二)公务卡用户分类指标体系构建
1.个人基本特征指标
公务卡用户个人基本特征会对行为和价值产生影响,在对用户进行分类时应该加入这类信息。本文从人口统计特征和社会特征两个方面提取指标,其中包括用户的性别、年龄、学历、职业、职位、所在地都市化程度、婚姻状况、住房状况、自有车状况、个人月收入、供养人口数、家庭月收入等指标。如图1所示
2.用户用卡行为特征指标
用户用卡行为主要由购买、还款、取现等行为组成,可以从消费特征、交易特征两个角度分析提取指标。消费特征反映用户对特定商品类型的偏爱,包含的指标有受卡方类型、受卡方消费金额、受卡方对应消费次数,交易特征包括交易类型、交易金额、交易次数等指标。如图2所示
部分指标说明为,第一,受卡方类型:银行分配给特别商户的代码一般进行分类,本文为了方便在宏观上发现用户的消费特征,将受卡方按消费类别分为五类,分别为①商场、超市等零售业,②餐饮酒店类,③住宿类,④交通类,⑤网上消费。第二,交易类型:指消费、取现、透支、还款等交易代码
3.公务卡用户价值特征指标
针对公务卡用户的价值,有很多不同的定义和评价方法。其中比较有影响力的价值分类方法是将用户的价值分为当前价值和潜在价值。这虽然在理论上很完善,但实际操作却很难实现。因为用户的潜在价值量化非常困难,去银行搜集与之相关的数据也不容易得到,所以本文仅考虑用户的当前价值。当前价值是公务卡用户的行为所产生的,所以也可理解为行为价值。可以选取商户回佣、透支利息、滞纳金收益、年费收入、存贷款利差、其他收入等指标作为用户价值的主要指标
从图3可以看到,商户回佣对应的是公务卡用户的购买行为,是用户购买活动所带来的价值,而滞纳金分别对应着逾期产生的罚金,透支利息是免息期外产生的费用,受透支时间和金额影响,存贷款利差是公务卡账面金额带来的收益
4.公务卡用户账户特征指标
公务卡账户特征包括卡账户的基本特征和信用特征,卡账户基本特征包括持卡类型、开卡时间、账面余额、透支金额等指标,信用特征包括信用额度、信用等级、逾期等级、违约情况等指标。如图4所示
5.用户分类指标体系构成
公务卡个人信息:性别、年龄、学历、婚姻状况、住房状况、职业、职位、个人月收入、供养人口数、家庭月收入。用卡特征:受卡方、受卡方对应消费金额、受卡方对应消费次数、月均刷卡次数、月均消费金额、月均取现次数、月均还款次数、月均取现额、月均还款额。价值特征:商户回佣、透支利息
原创力文档


文档评论(0)