- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据环境下电子数据审计应用
大数据环境下电子数据审计应用
[摘 要] 本文以某市商务促进专项资金审计为例,使用可视化技术确定审计重点,通过关联分析多部门数据查找疑点,对大数据环境下电子数据审计的应用的难点和可行性进行了研究。
[关键词] 大数据;电子数据审计;关联分析
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 05. 011
[中图分类号] F239.1 [文献标识码] A [文章编号] 1673 - 0194(2018)05- 0026- 02
1 前 言
随着我国财政专项资金规模持续扩大,考虑到财政专项资金具有补助金额大、补助项目分散等特征, 审计人员如果使用传统的审计方法,将无法实现对专项资金的监管职能,因此使用电子数据审计方法对财政专项资金进行审计非常必要。伴随着审计信息化的不断发展,亟需开展以大数据为基础的审计探索,从而更好地发挥审计的监督职能。
由于部分审计人员对审计信息化、大数据的认识还停留在传统的审计思维观念中,无法对海量业务数据实现分析处理,导致大量的数据未有效使用;特别是财政等数据种类多、数据量大,使用手工审计方法将无法对项目多、涉及部门广的专项资金实现全面审计,因此研究并实现专项资金的大数据审计是很有必要的。
本文以某市商务促进专项资金审计为例,确定审计重点,总结被审计数据的特点,进一步选择合适的数据处理方法。将内部数据和外部数据关联分析,查找疑点线索。使用传统的数据分析技术和大数据可视化技术等技术分析数据,展示大数据技术在专项资金审计中的可行性。然后总结研究内容和结果,分析大数据环境下对专项资金实行审计的有效性,提出有待解决的难点和需要完善的问题。
2 商务促进专项资金数据来源
某市201×年度拨付中央和市级商务促进专项资金共计7.6亿元。中央外经贸促进专项资金用于扶持市服务外包项目、进出口贴息和中小企业发展。市级商务促进专项资金用于补贴企业涉外参展、中东欧经贸合作以及出口品牌等项目。
本审计案例的数据来源广,涉及某市商务委、工商、地税、海关等部门,包括:各项拨付情况表、补贴报告、补助明细表、工商数据、地税数据、海关进出口数据,其中包含了大量的非结构化数据,如政策性文件、图片等。商务促进专项资金审计调查工作涉及面广,数据多而杂,仅依靠手工审计难以完成审查任务,需要借助计算机技术,对多个部门的数据进行关联分析、横向对比,通过可行的大数据技术对文档进行分析,筛选出重点内容,提高审计实施效率。
3 审计工具介绍
3.1 Excel
Excel以其简单性和易操作性在计算机审计领域得到了广泛的应用,已经成为审计人员必备的重要工具之一。随着信息化后被审计单位的数据更加庞大和复杂,审计人员必须在海量数据中提取有价值的信息,Excel2007以后版本提供了数据挖掘外接程序DMAddin.msi,涵盖了决策树、贝叶斯、聚类等主要的数据挖掘算法,这为审计人员开展审计数据挖掘提供了新的方法。
3.2 SQL Server
Microsoft SQL Server是一个分布式的关系型数据库管理系统,它具有独立开发的SQL语言,并支持对称多处理器结构、存储过程、ODBC开放数据库连接。SQL语句执行各种各样的操作,如对数据库中的数据进行修改,筛选数据等。SQL Server分析服务是与数据库服务并列的服务,整合了后台的数据库服务和前台的商业应用程序,主要功能有多个数据源视图共享一个数据源、通过钻取从数据库服务器提取完整的事例信息、交叉检验。
3.3 NLPIR大数据处理工具
大数据环境下非格式化数据比例非常大,如何审计非格式化数据,发现审计线索,是值得研究的。大数据搜索与挖掘共享平台(以下简称NLPIR)具有完整的大数据技术处理流程,能够满足审计人员对大数据文本的处理需求。并且它能够提供丰富的开放接口,审计人员可使用各类主流开发语言调用所有功能。
4 电子数据审计工具的应用及分析结果
4.1 NLPIR可视化
本部分首先使用NLPIR平台对文件进行分析,以确定审计重点。非结构化数据的信息量和信息的重要程度很难被界定,分析成为了难点,但由于数据来源的多样性、数据的高价值等特点,使得审计中分析非结构化数据成为必然。对非结构化数据进行可视化分析,是大数据审计的研究重点,标签云是可视化的方式之一。实现中文标签云步骤主要包括分词,统计词频,根据词频设置字体大小。NLPIR平台通过文章提取、中英文分词、词频统计、关键词提取等步骤实现大数据可视化。
将《关于拨付某市商务促进专项资金的函》导入NLPIR中,对文档进行分析,通过分词处理和词频统计后,发现“海关”“进口”“比例”等词语频率
原创力文档


文档评论(0)