基于数据挖掘的在线审计模型设计.docVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据挖掘的在线审计模型设计.doc

基于数据挖掘的在线审计模型设计   摘 要随着在线审计系统的运行和管理,在线审计已经积累了海量的数据资源,为了能够更好的挖掘数据中潜在的知识,提高在线审计的准确度,帮助人们进行决策,论文分析了在线审计模型引入数据挖掘算法的必要性,同时描述了数据挖掘算法的背景理论及作用,分析了在线审计系统的功能,设计了一个强大的基于数据挖掘的在线审计模型,更好地保证在线审计快速性、准确性和有效性。   【关键词】在线审计 数据挖掘 预处理   1 引言   随着世界经济的全球化、一体化的发展,企业规模越来越大,经营的业务也日渐复杂,传统的审计模式已经不能够达到预期的效果,导致世通、安然等产生大量的财务舞弊事件,这些财务舞弊事件给世界经济的发展带来了严重的危害,也凸显了传统的人工审计、分期审计模式存在许多的缺陷和问题,人们亟需引入新的设计方法或模式,弥补传统审计存在的风险。光纤通信、移动通信、数据仓库等信息技术的发展促进人们进入“互联网+”时代,人们提出了许多的自动化审计系统,这些审计系统能够实现自动化、持续化、实时化的审计管理,系统的运行积累了海量的数据资源,激增的数据隐藏着更多的有价值的信息,能够帮助人们识别财务舞弊线索,但是也带来了较为严重的问题,这些问题包括以下几个方面:   (1)数据量过大,无法实时的获取有用的信息。审计系统经过多年的运行,由于这些系统运行积累了海量的数据资源,这些数据量非常大,一般的审计系统无法很好地利用这些信息,因此不能够对审计决策作出帮助。   (2)数据格式不一致,难以处理。不同的企业、经济体运行均采用不同的审计系统,因此审计系统产生的数据格式不一致,这些信息难以整合在一起,不利于人们进行统计和分析。   (3)数据不断运行和发展,但是财务舞弊的模型较为固定,没有自学习功能,因此许多的数据审计模式都是滞后的,这种不同步性给财务舞弊风险识别带来了巨大的风险,更加不利于审计发现。   (4)审计分析方法落后。传统的数据分析方法较为落后,仅仅采用固定的模式,因此这些工具不能够实时的从广度和深度进行学习和分析,为在线审计提供了强大的接口,但是在线审计系统的电子化、网络化发展和普及应用也为财务舞弊隐藏的更深,这样就难以识别。   因此,为了能够解决上述问题,人们提出在在线审计系统中引入数据挖掘技术,构建一种动态学习的审计模型,可以实时的发现数据中隐藏的有价值的信息,这些模式均隐藏在大型数据库、数据仓库中,其可以为数据集提供一个全面而深刻的认知,高度抽象和概况数据信息内容,将人们对数据的感性认识提升到理性认识,因此将数据挖掘技术应用于审计工作具有重要的作用和意义。   2 相关背景理论   数据挖掘是一种大数据分析方法,其可以从数据中寻找隐藏的知识信息,数据挖掘的结果通常划分为两种模型,分别是描述型和预测型。描述型的数据挖掘任务可以从刻画数据库中相关的数据相关特性,预测数据可以针对海量数据中隐藏的知识进行预测和推断。数据挖掘的主要功能包括以下几个方面,分别是聚类分析、分类和预测、偏差检测、关联序列分析等。   2.1 关联和序列分析功能   数据库中保存着海量的审计数据信息资源,并且这些审计数据信息资源存在极大的关联关系,并且也是变量之间存在的某种相关规律,关联的功能主要是寻找潜在的相关审计知识内容。分析内容的相关性可以增加时间属性,因此数据挖掘功能可以实现的关联分析与序列发现功能,一种是简单关联关系、一种是时序关联关系,为了能够更加清晰的展示简单关系,比如在企业审计过程中,企业购买车辆的同时肯定会购买车辆保险,这就是一个简单关联关系;企业为了办公方便,购买激光打印机一个月之后,肯定会采购硒鼓,这就是时序关联关系,在大型数据集中,产生关联的规则非常多,一般可以使用可信度和支持度进行筛选。   2.2 分类和预测功能   数据挖掘最为关键的功能之一是数据分类,在线审计过程中,政企单位最期望的就是能够分类审计数据内容,并且预测未来的审计,按照不同的属性将审计内容划分到一个个的分类模型,这样就可以更好的利用专家知识实现审计内容分类化、清晰化管理。预测管理可以利用审计内容上下文信息,预测审计对象的发展趋势。   2.3 聚类   如果一个审计内容数据集缺乏详细的描述信息,无法采用任何已知的在线审计分类模式对其进行筛选,此时可以采用聚类分析方法,在无监督学习环境中,将审计内容划分为多个簇,同时保证簇间的相异性,尽可能的保持簇内高度相似性、同构性,把符合发展规律的审计数据划分到一个类别,把不同类别的数据划分为一个类别,这样就可以区分正常数据和异常数据。   2.4 偏差检测   偏差检测又被称为离群点检测,可以发现正常数据流中存在的一个重要功能,并且可以发现企业财务舞弊过程中的不正常内容,可以从正

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档