关联规则分析及其在信用卡反欺诈中的应用 孙大利.pdfVIP

  • 30
  • 0
  • 约4.88千字
  • 约 2页
  • 2019-07-05 发布于未知
  • 举报

关联规则分析及其在信用卡反欺诈中的应用 孙大利.pdf

业务平台 管理 关联规则分析 及其在信用卡反欺诈中的应用 中国银联风险管理部 孙大利 关联规则分析作为数据挖掘中一个重要的组成部分, 集算法作为核心算法,并在此基础上提供多种优化途径选 能够有效发现大量数据中相关属性集之间有趣的关联关 择。 系,从而为政策或规则的制定提供参考依据。近年来,关 联规则分析已被广泛应用到零售、物流、信用卡营销及风 二、关联规则分析的基本算法 险管理等众多领域。基于此,本文从介绍关联规则分析的 先验频集算法是目前关联规则分析方法的基础,其核 基本概念和算法入手,探讨其在信用卡反欺诈中的具体应 心是基于两阶段频集思想的递推算法。 用,以期对提升信用卡业务风险管理技术有所裨益。 首先,先明确项集、事务集、支持度、频集以及置信 度等概念。项目集是关联规则分析的数据集合中的组织单 一、关联规则分析的基本概念与发展 元,简称项集;事务集即数据集合,是由项目集组成的并 众所周知,关联规则中最为有趣的一个应用案例就是 集;支持度定义为P (A ∪B ),即A 和B 这两个项集在事务 沃尔玛“尿布和啤酒”的故事,这是一个典型的购物篮关 集D 中同时出现的概率;所有支持度大于最小支持度的项 联分析。从这个案例中可以看出,关联规则分析实际上是 集称为频繁项集,简称频集;置信度则被定义为P (B |A), 借助一些原则,如取交叉频率最大值等,在不同的数据集 即在出现项集A 的事务集D 中,项集B 也同时出现的概率。 中寻找相互之间的联系,分析诸如顾客购买了某一商品对 其次,给定一个事务集,预先设定最小支持度阈值和 购买其他商品的影响,然后归纳出不同顾客的具体购买行 最小置信度阈值,通过具体算法寻找同时满足最小支持度 为模式。零售类企业一般将关联规则分析应用于商品货架 阈值和最小置信度阈值的关联集合,此类集合中项集之间 布局、货存安排以及根据购买模式对用户进行分类;而在 的关联关系称为强规则。 信用卡业务中,则可将关联规则分析用于分析持卡人消费 最后,挖掘关联规则的先验算法将关联规则分析分解 行为模式、不良持卡人信息特征以及信用卡欺诈行为特征 为两个阶段的子问题。一是根据最小支持度找出数据集中 等。 所有不同长度的、满足给定支持度要求的频集;二是由频 关联规则分析的应用研究,最早见诸于R.Agrawal等 集产生强关联规则。当然这些规则必须满足最小支持度和 于 1993 年提出的挖掘顾客交易数据库中项集间关系的先 最小可信度。 验(A priori)频集方法,在此之后诸多对关联规则分析的 应用研究开始涌现。对原有的算法进行优化,如引入随机 三、关联规则分析在信用卡反欺诈业务中的应用 采样、并行思想等,以提高算法挖掘规则的效率;注重于 近年来,关联规则分析在信用卡业务中的应用得到很 对挖掘到的模式的价值进行评估探索,挖掘独立于先验频 大发展。以信用卡欺诈行为特征识别为例,境外发卡银行 集方法的关联规则的新方法。目前,主流的关联规则分析 通过对发生欺诈交易的历史数据分析,发现在大额欺诈交 软件,如 SAS 统计软件中的 EM 工具等,多采用先验频 易(如购买珠宝等)之前往往会出现小额试探性交易(如 36 中国信用卡 2007.11 管理 业务平台 自助加油等),并且这些小额试探性交易往往发生在夜间

文档评论(0)

1亿VIP精品文档

相关文档