- 30
- 0
- 约4.88千字
- 约 2页
- 2019-07-05 发布于未知
- 举报
业务平台 管理
关联规则分析
及其在信用卡反欺诈中的应用
中国银联风险管理部 孙大利
关联规则分析作为数据挖掘中一个重要的组成部分, 集算法作为核心算法,并在此基础上提供多种优化途径选
能够有效发现大量数据中相关属性集之间有趣的关联关 择。
系,从而为政策或规则的制定提供参考依据。近年来,关
联规则分析已被广泛应用到零售、物流、信用卡营销及风 二、关联规则分析的基本算法
险管理等众多领域。基于此,本文从介绍关联规则分析的 先验频集算法是目前关联规则分析方法的基础,其核
基本概念和算法入手,探讨其在信用卡反欺诈中的具体应 心是基于两阶段频集思想的递推算法。
用,以期对提升信用卡业务风险管理技术有所裨益。 首先,先明确项集、事务集、支持度、频集以及置信
度等概念。项目集是关联规则分析的数据集合中的组织单
一、关联规则分析的基本概念与发展 元,简称项集;事务集即数据集合,是由项目集组成的并
众所周知,关联规则中最为有趣的一个应用案例就是 集;支持度定义为P (A ∪B ),即A 和B 这两个项集在事务
沃尔玛“尿布和啤酒”的故事,这是一个典型的购物篮关 集D 中同时出现的概率;所有支持度大于最小支持度的项
联分析。从这个案例中可以看出,关联规则分析实际上是 集称为频繁项集,简称频集;置信度则被定义为P (B |A),
借助一些原则,如取交叉频率最大值等,在不同的数据集 即在出现项集A 的事务集D 中,项集B 也同时出现的概率。
中寻找相互之间的联系,分析诸如顾客购买了某一商品对 其次,给定一个事务集,预先设定最小支持度阈值和
购买其他商品的影响,然后归纳出不同顾客的具体购买行 最小置信度阈值,通过具体算法寻找同时满足最小支持度
为模式。零售类企业一般将关联规则分析应用于商品货架 阈值和最小置信度阈值的关联集合,此类集合中项集之间
布局、货存安排以及根据购买模式对用户进行分类;而在 的关联关系称为强规则。
信用卡业务中,则可将关联规则分析用于分析持卡人消费 最后,挖掘关联规则的先验算法将关联规则分析分解
行为模式、不良持卡人信息特征以及信用卡欺诈行为特征 为两个阶段的子问题。一是根据最小支持度找出数据集中
等。 所有不同长度的、满足给定支持度要求的频集;二是由频
关联规则分析的应用研究,最早见诸于R.Agrawal等 集产生强关联规则。当然这些规则必须满足最小支持度和
于 1993 年提出的挖掘顾客交易数据库中项集间关系的先 最小可信度。
验(A priori)频集方法,在此之后诸多对关联规则分析的
应用研究开始涌现。对原有的算法进行优化,如引入随机 三、关联规则分析在信用卡反欺诈业务中的应用
采样、并行思想等,以提高算法挖掘规则的效率;注重于 近年来,关联规则分析在信用卡业务中的应用得到很
对挖掘到的模式的价值进行评估探索,挖掘独立于先验频 大发展。以信用卡欺诈行为特征识别为例,境外发卡银行
集方法的关联规则的新方法。目前,主流的关联规则分析 通过对发生欺诈交易的历史数据分析,发现在大额欺诈交
软件,如 SAS 统计软件中的 EM 工具等,多采用先验频 易(如购买珠宝等)之前往往会出现小额试探性交易(如
36 中国信用卡 2007.11
管理 业务平台
自助加油等),并且这些小额试探性交易往往发生在夜间
您可能关注的文档
- 低油耗就是环保.pdf
- HPLCELSD测定地黄寡糖中地黄苷A含量.pdf
- 滚针轴承接触分析.pdf
- 高压加氢换热器Omega环开裂失效分析.pdf
- 第11章齿轮传动.pdf
- PC钢棒生产线送料机夹送辊断轴原因及改进.pdf
- 大口径潜水排污泵.pdf
- 分析化学第三章滴定分析法概论.pdf
- 磁性纳米材料及其在癌症诊疗中的应用888.pdf
- 产科院内感染的预防与控制措施.pdf
- HP56SY 水浴式氮吹仪(TERMOVAP SAMPLE CONCENTRATOR)1.pdf
- §3.3 定轴转动中的功能关系.pdf
- 第03章 MCS51单片机汇编语音程序设计清华单片机课件.pdf
- inWatch映趣Fusion智能手表入手记.pdf
- UnderArmour安德玛ColdGearFlash闪电侠男款运动衫.pdf
- TUMI塔米AlphaSlimfoldIDWalle黑色竖版尼龙男士钱包.pdf
- SPC在实验设备质量控制中的应用 陈宏.pdf
- 国行KindleVoyage珍藏限量版标准版.pdf
- 财务管理之xx市审计局20年精神文明建设工作总结.pdf
- 草莓根腐病菌拮抗细菌的分离与鉴定.pdf
原创力文档

文档评论(0)