数据挖掘技术在识别可疑金融交易中应用.docVIP

数据挖掘技术在识别可疑金融交易中应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在识别可疑金融交易中应用

数据挖掘技术在识别可疑金融交易中应用   摘 要: 随着企业数量不断增多,经济水平日益提高,各种金融交易活动也日渐频繁。在一系列金融交易活动中,最容易出现的一种犯罪就是洗钱。本文主要介绍了数据挖掘技术及其算法,以及如何利用数据挖掘技术识别可疑的金融交易。    关键词:数据挖掘 可疑交易 反洗钱    中图分类号:F832 文献标识码:A 文章编号:1003-9082(2015)01-0073-01   一、前言   随着我国经济的发展,各种金融交易活动也逐渐增多,与之伴随的就是洗钱活动的频繁发生,我国的反洗钱工作正在不断地深入开展。依靠传统的手工处理或简单数据库处理系统来识别金融交易当中的犯罪已变得无法胜任,充分利用数据挖掘技术来识别可疑交易在全球迅速推广应用。由于我国的国情以及技术水平,该项技术的应用和普及情况仍不尽人意。如何从海量的混合类型的金融数据中挖掘出与洗钱活动相关的交易数据,为发现可疑交易提供数据支持,需要我们在方法上进行探索,在应用上进行实践。   二、数据挖掘技术概述   从广义的角度来说,数据挖掘就是从存放于数据库、数据仓库或其信息库中的大量数据挖掘出有趣知识程的过程。数据挖掘所研究的领域很广,涉及到识别模式、数据库、机器学习、人工智能还有分布式计算、可视化技术等等,是不同学科结合的产物,这是一个新兴的技术,但是其又有很大的发展空间。数据挖掘技术根据其主要任务的不同,可以划分成为如下几类。第一、关联规则挖掘,它是从大量数据中发现项集之间关联或相关联系,可用于商业决策制定上;第二、分类以及预测,分类是通过分类函数将数据集当中的某个样本映射到某一个已知分类上面。分类方法主要包括决策树、贝叶斯、人工神经网络等等,可用于部分监测模型建立;第三,聚类分析,与分类的不同之处在于它所划分的簇是未知的,按照的规则是物以类聚,将条件相似的对象划分在一个簇里面,通过聚类分析将相似行为的客户划分到同类组中,可以用来监测可疑行为。第四、孤立点分析,即数据集中可能包含的与其它数据的一般行为或特征不一致的数据对象,用孤立点技术可以识别出极个别偏离正常业务的行为;第五、时序分析,数据演变分析描述行为随时间而变化的对象的发展规律或趋势,并对其建模,可以用于预测股票走向。   三、可疑金融交易的特征分析   可疑金融交易是指金融交易当中的频率、流向、来源以及金钱的用途出现了异常的行为。从反洗钱的监督实践来看,可疑的金融交易通常有如下的几个特征。   1.交易的频率以及交易金额异常   通常来说,有着真实背景的企业其日常的金融交易是具有一定规律性的。洗钱交易与之相比较,因为真实交易背景的缺乏,其交易的频率往往没有周期性且交易的方式也没有固定性。在洗钱犯罪当中,洗钱者所面临的最大问题就是如何将非法所得的大量现金变成可以携带或者隐藏的形式,洗钱者为了避免被发现,经常采取快进快出的方法,导致其交易的频率以及交易金额都会与正常的交易不一样,具体表现为和背景资料不一致的大量现金的频繁交易。在洗钱交易的初期,其最大的特征就是入账的金额是巨大的,流动的次数是频繁的。   2.交易的流向或者来源异常   洗钱交易和正常金融交易的目的是不一样的,所以其交易的地点和洗钱的热点地区都会有很密切的联系。   3.交易的用途或交易性质异常   该项特征是指在交易过程中,交易者的交易用途与所申报的背景资料不相匹配,违背了实际经营情况。   四、数据挖掘技术在识别可疑金融交易当中的研究   数据挖掘算法的适应性直接影响所发现知识的价值。在反洗钱领域中,回归分析、分类分析和聚类分析、决策树算法、神经元网络、遗传算法等都具有较强的适应性,具有广阔的应用前景。目前应用在可疑金融交易识别中的数据挖掘过程主要包括:数据采集、数据预处理、属性过滤、数据清理、数据特征化、数据分析等。   以聚类分析来说,为了达到期望的聚类的结果,属性选择是很重要的,错误的选择可能导致聚类结果是无效的。举个例子:我们知道账户中交易是有借和贷两个方向的,可以统计出一个账号在当日前有限日内的贷记交易次数与借记交易次数,计算两者的比值,然后将此比值的聚类结果与阈值进行比较,区分是否为分散转入集中转出还是集中转入分散转出或是正常资金周转。这里的借贷交易次数比值就是能够参与分析的有效属性。而像客户名称、客户地址等之类的信息在聚类过程中就属于可剔除的属性。   另外,在进行数据分析时选取的算法也很关键,并不是说使用某一种算法就可以识别出来大部分类型的可疑交易。不同的算法是具有针对性的。以聚类分析为例来说明:由于洗钱行为在整个金融活动中只占极少部份,而且洗钱的模式也多种多样。可疑账户不可能聚集在一起成为一个聚类中心,只有大部份正常经营的企业账户或是按正常模式存

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档