- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅议数据挖掘技术在计算机审计中应用
浅议数据挖掘技术在计算机审计中应用 摘要:在信息化大环境下,随着金审工程的推动,数据挖掘技术在审计领域的应用越来越广泛。它能辅助审计人员从审计数据中发现隐藏的、有用的知识信息,形成明确有效的审计思路,得出正确的审计结论。该文简要介绍了数据挖掘技术,讨论了数据挖掘技术在计算机审计中的应用,并给出了数据挖掘技术在计算机审计中的具体应用步骤。
关键词:审计;数据挖掘;计算机审计;技术;应用
中图分类号:F239 文献标识码:A 文章编号:1009-3044(2013)15-3445-02
随着网络的发展,我国的审计事业步入了计算机审计时代,这样以来大大提高了审计工作的效率。在实际审计过程中,审计人员还要改变自身的审计分析思路,要打破传统的审计模式,能够运用系统论的思维,以全局的观点、联系的观点,把握事物的总体和各部分之间的联系,从而发现其中的规律。可以借助于一种数据分析工具——数据挖掘技术,它能够帮助审计人员从海量数据当中,发现数据背后潜在的联系和规律。
1 数据挖掘的定义和常用技术
数据挖掘(DM),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中的、人们事先不知道的、但又是潜在的、有用的信息和知识的一种过程。
通过数据挖掘,不但可以来完善、丰富数据库,也为用户决策提供数据支持。常用的技术有以下几种:
1.1关联分析
关联分析的目的是为了找出数据库中隐含的关联规则。
1.2分类
分类对数据概念的描述建立模型,再用这个模型来进行分类,生成一系列的分类规则,用于对其他的数据进行分类,从而更好地理解数据库中的内容。
1.3预测
预测就是找出历史数据之间的变化规律,建立相应的模型,可以获得当前数据的未来变化趋势,所具有的属性值的范围、种类和特征等。常用的方法是回归分析法。
1.4聚类分析
聚类是一个将数据集划分为若干组或类的过程,类似于人们常说的“物以类聚”。
1.5偏差检测
数据库中的数据之间存在着很多异常的情况,称为偏差。这些偏差包括很多潜在且有用的知识,如分类中的反常实例、模式的特例等。
1.6时序模式分析
通过时间序列搜索出重复发生概率比较高的模式。
在实际审计过程中,选择合适的挖掘技术能给审计工作带来很大的帮助,而且不同的挖掘技术应用的对象也不同。
2 数据挖掘的应用价值
从审计角度来看,数据挖掘就是根据事先明确的审计目标,对被审计单位的大量业务数据进行分析,揭示其中潜在的逻辑关系和规律,并进而形成明确且有效的审计思路的过程。
数据挖掘技术在审计中的应用价值,主要体现在可以依据其发现的知识来构建审计分析模型,将其运用到实际的审计业务中,可以大大提高审计工作的效率。比如,通过对银行信用卡恶意透支的历史数据进行数据挖掘,可以发现“信用卡恶意透支与信用卡客户的收入状况、平均消费额、职业、年龄等客户属性之间的联系”这类知识,以此为基础构建出相应的审计分析模型并运用到被审计银行的当前信用卡业务数据中,审计人员就可以快速确定审计重点。
3 数据挖掘技术在计算机审计中的应用操作步骤
一般来说,数据挖掘技术在计算机审计中的操作步骤主要有以下几步:
3.1审计业务问题的定义
指的是要明确审计时需要发现什么信息、解决什么问题。这个定义驱动了整个数据挖掘的过程,是整个挖掘过程的基础,也是检验最后结果的依据。
3.2数据准备
这个环节包括数据采集、数据清理和数据预处理三项内容。
数据采集要尽可能地采集所有与需要解决的审计业务问题密切相关的数据。
数据清理将采集到的数据经过数据清理形成审计中间表,这些审计中间表就成为数据挖掘模型的实例数据集。
数据预处理工作首先进行数据集成,整合来自不同数据源中的数据,然后从集成的数据库中选择性地提取用与挖掘的数据,最后再对选择的数据进行投影、归一化变换等处理,方便进行下一步的数据挖掘。
3.3建立模型,挖掘数据
设计人员(包括经验丰富的审计人员)对预处理好的数据进行分析,选用合适的数据挖掘技术和方法,生成适合挖掘的数据模型。模型建立的好坏关系到数据挖掘结果的正确与否,可以说是整个挖掘过程的核心。模型不是一成不变的,需要经过反复的修改调整,最后才能成为适合当前的审计任务要求的挖掘模型。
利用建立好的模型,进行数据挖掘,输入相关审计数据,会得到具体的结果,或者数据间的规律。审计业务人员要根据这些结果,对模型以及模型的输入参数值进行多次的修正和完善,以利于得出正确的挖掘结果。
3.4分析评价结果
将挖掘模型最后得到的正确的结果,提供给审计人员。审计人员根据审计任务要求和被审计对象的特征
文档评论(0)