- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
孤立点分析在税务审计上发展运用
孤立点分析在税务审计上发展运用
摘 要: 在对海量数据的进行税务审计的面前,基于数据挖掘技术的孤立点分析是一项极为有效的技术,它可以发现隐藏的问题数据,通过专业审计判断后,提供给审计人员有效的审计线索,提高准确度与工作效率。
关键词: 孤立点;数据挖掘;税务审计
中图分类号:TP391 文献标识码:A 文章编号:1671-7597(2012)1010113-02
0 引言
审计作为一种独立性的经济监督活动,对被审计单位相关经济活动具有特有的制约和促进作用。审计的职能就是通过对数据的检查,监察财务收支的真实、合法性,总结效益情况,同时发现和揭示重大问题或风险隐患。近年来,随着经济建设的不断发展,税务审计的任务也越来越重,在日积月累的数据量的不断增加下,使用原有的审计也难以满足实际要求。随着审计技术运用的不断深入,内部审计人员感觉可发现的审计线索少了,问题越来越隐蔽。而以往的分析技术倾向于发现个案的存在,但对审计对象的整体风险情况无法进行全面的把握。
对审计部门困扰的主要有以下问题,一是由于各单位业务逐步出现了高度电子化,数据海量化,关注广泛化,产品衍生化,环境多样化的情况,让审计效率明显降低。二是审计在其执行过程中,所用的工具和程序都是基于事先的审计假设,而审计假设则是由审计人员通过以往的正常情况或者发展趋势进行人工分析得出判断和说明,但是由于个人的经验和知识是有限的,随着时间的发展,业务流程的更新,产品和技术的产生,造成了模型相对滞后,对面新的情况和海量的数据着手困难[1]。针对这些问题,人们逐步开始利用数据挖掘技术来进行解决。本文主要描述基于数据挖掘的孤立点分析在税务审计方向上的发展与运用。
1 数据挖掘技术
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它可以进行历史数据的查询和遍历,发现数据仓库中对象演变特征或对象发展趋势,也能找出过去数据潜在的关系,从而进行信息的挖掘,还可以根据过去的数据对未来进行预测和???类。
数据挖掘与传统的数据分析的本质区别就是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。
数据挖掘现阶段在税务审计中主要应用了聚类技术、分类与预测技术、关联技术、孤立点发现技术等等[2]。
2 孤立点的定义与产生
2.1 孤立点的定义
孤立点分析是数据挖掘中的一个重要研究方向。利用数据挖掘技术可以在海量的数据处理过程中获得一般模型,但这些数据并不是全部适用于这个一般模型,比如一些特殊值。这些不符合一般数据模型的数据从数据处理的目的来说可能就是数据整体的孤立数据、异常数据、偏差数据或者噪声数据。它们也有它们的共同特性,就是与海量数据中的其他数据有着明显的不一致,这些数据,我们统称为孤立点。
一般的孤立点分析在数据挖掘中存在两个基本任务:一是在给定的数据集合中定义什么样的数据可以被认为不一致的;二是找到一个有效的方法来挖掘这样的孤立点[3]。
2.2 孤立点的产生
孤立点的产生原因是多方面的,简单来说,可以归纳为以下几个方面:
一是人为操作错误所致。譬如,因为数据库没有年龄约束限制,在输入年龄时发生了数字录入错误,把21岁录入成211岁就属于人为操作错误。
二是人为欺诈行为所致。为了某种目的而直接对数据进行违背事实的更改或者添加,造成数据值与实际情况有很大区别。个别单位虚报的统计数据就属于此类。
三是由于仪器或者设备出错导致。在数据采集过程中测量仪器或者设备难免不会受到外界的影响而使得采集到的数据出现错误。
四是数据系统的变化或者故障。数据系统在运行或者搬迁的时候,可能因为个别不可预料的操作对其中的数据造成影响。比如数据库的搬迁,恢复时出现小范围报错的情况。
五是数据发生自然偏差导致。事物是不断发展和变化的,在这个过程中是符合自然规律的,而这些变化和发展也会对其中的数据产生影响。比如同一个公司里职员升职为经理后工资就会高出不少,但这些变化却是合理的存在从上面的原因来看,孤立点不论是怎么产生的,都并不是毫无意义的异常数据。这些孤立点数据对总结海量数据得出一般模型不会产生积极作用,但从这些估计点进行分析却能够获取到有价值的信息。作为税务审计人员,就应该特别重视孤立点数据,从中深究出审计线索。
3 孤立点在税务审计上的运用
因为税务审计业务的性质,决定了在税务审计中运用数据挖掘技术来对海量数据的孤立点进行分析能够取得比较好的审计线索,从而达到审计的目的。在税务审计工作中,通过基于数据挖掘的孤立点分析来查找审计线索特征主要分为以下三个步骤。
3.1 寻找孤立点的数据准备
数据的准备可以分为三个主要步骤:一是数据选取,二是数
您可能关注的文档
- 多媒体在广告学原理课程教学中应用探讨.doc
- 多媒体在模拟电子技术教学中运用.doc
- 多媒体在英语阅读教学中辅助作用.doc
- 多媒体在课程改革中应用.doc
- 多媒体实验室管理维护探讨.doc
- 多媒体技术与高中政治学科整合有效性实践研究.doc
- 多媒体技术与高中数学教学整合.doc
- 多媒体技术在专业教学中误区探讨.doc
- 多媒体技术在对外汉语教学中应用探讨.doc
- 多媒体技术在小学语文课堂教学中运用体会.doc
- 读后续写--母子钢琴“合奏”(杭州二模).pptx
- 大冶湖防洪综合治理工程投资估算单行本2020.8.8.pdf
- 读后续写--狗子的fun run(2023.4宁波二模).pptx
- 读后续写--十二天的善意(2023.4湖北省调研模拟卷).pptx
- 读后续写--猫猫救主(2023.3宁波十校联考).pptx
- 跨境电商国外电商购物节黑色星期五购物活动策划PPT模版.pptx
- 蓝色红色励志简约部门工作述职报告ppt模板.pptx
- 中国传统节日下元节祭奠先祖缅怀先人介绍PPT模版.pptx
- 双11电商促销狂欢节双十一活动营销策划活动方案PPT模版.pptx
- 红色剪纸风金蛇迎春开门红工作规划报告PPT模版.pptx
最近下载
- SY_T 5660-2020 钻井液用包被絮凝剂 聚丙烯酰胺类.pdf VIP
- 2021-202x年基金管理人员工跟投基金投资协议-经典(律师审定版).docx
- 2010-2015年 中国电梯行业市场发展前景及投资分析报告.doc
- 78度智慧参考资料.pdf
- 基层儿科医务人员服务能力提升学习班答案-2024华医网继续教育答案.docx VIP
- DELTA台达伺服驱动器 ASDA-A2使用手册-操作说明书.pdf
- 国际贸易实务英文版(第五版)周瑞琪教材辅导习题解答.pdf
- 基于高斯滤波和近似积分的电动车窗防夹算法.pdf
- Application for Export Transaction 离岸客户填写指南.doc VIP
- 2023年膨化食品行业市场需求分析报告及未来五至十年行业预测报告.docx
文档评论(0)