数据挖掘技术运用于税收征管思考实践.docxVIP

数据挖掘技术运用于税收征管思考实践.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术运用于税收征管的思考与实践 内容提要:随着信息化的加快发展,税务系统累积了大量的涉税信息和数据,如何进一步加强这些海量数据信息资源的开发和利用,使其更好为税收管理服务,为税收决策提供科学依据,已成为越来越突出的一个重要课题。本文引用数据挖掘的前沿理论和技术,阐述了其应用于税收工作的可行性,并结合基层比较实用的一些数据分析运用模型和方法,对数据挖掘技术运用于税收征收管理提出初步的思路和想法。 关键词:信息化 数据挖掘 分析平台 近些年来,随着国民经济的快速发展和经济活动形式日益多样化,税收管理中暴露出来的问题和矛盾也越来越突出。第一,户多人少的矛盾。由于经济总量不断扩大,纳税人户数逐年攀升而税收征管力量增加有限,人均管户、管事量有增无减。数据显示,从2001年到2010年间,全国税务登记的纳税人总数从1500万上升到2600多万,增长了75%,年均增长5.8%,而10年来税务系统干部仅增长1.07%;第二, 征纳双方信息不对称的矛盾。纳税人的组织形式、经营方式、经营业务不断创新和拓展,税源跨国、跨行业、跨区域相互渗透,而税务部门征管手段有限,征纳双方信息不对称的矛盾日益加剧;第三,税收管理的高要求与税务队伍能力水平的矛盾。涉税业务呈现复杂化和多样化,企业核算和税务处理日趋电子化、团队化和专业化,税收管理上亦提出了越来越精细化的目标要求,要求税务人员不仅要懂税收,更要掌握经济、法律、计算机网络技术等多学科知识,税务系统高精尖复合型人才培养的速度、整体能力水平的提升跟不上税收征管面临的复杂现状;第四, 开展税收执法与优化纳税服务的矛盾。纳税服务理论在税务系统不断得到强化,服务手段更加人性化和柔性化,入户执法项目大幅取消, 更多地依靠税务案头审计来实施和完成,而人工案头审计往往随意性大、漏洞多、效率低下。同时,越来越多的涉税审核认定事项从事前审批转为后续管理,后续管理监控失范手段弱化,都加大了内部执法的风险。如何破解这些矛盾,运用科学有效的方法、技术、手段来突破管理瓶颈,堵塞征管漏洞,从而提高税收管理的高效化、精细化水平,是一个迫在眉睫的课题。本文从阐述数据挖掘技术的理论和方法出发,对运用数据挖掘技术提高税收征管质量提出了一些建议,供省级及以下基层税务部门参考。 一、数据挖掘技术相关理论及在税务部门的应用可行性分析 (一)数据挖掘技术的理论要点 人类的社会和经济活动,一般情况下都可以用数据(数字或者符号)来进行描述和记录。比如,一名生产者通过生产经营活动,消耗的资源、产出的成品,都可以体现为一定单位量的数据。经过对这些基础数据的分析,就会产生信息;用这些信息来指导实践,就可以做出相应的决策;而这些决策又引发了新一轮的社会和经济活动。数据挖掘(Data Mining)就是上述循环进程中对数据信息的一种分析技术。它通过选择合适的特征属性,从大规模数据库中(或从其他来源)筛选数据,利用人工智能和数理统计等领域的科学算法对数据进行统计分析和模型构建,进而获取可视化的知识。从应用的角度而言,数据挖掘技术是一个从生成数据仓库、对接业务需求、智能分析加工、问题解决和成果运用的完整过程。 数据挖掘使用不同的算法技术来完成不同的任务。常用的数据挖掘技术可细分为: 数据挖掘 预测型 描述型 分类 回归 时间序列分析 预测 描述统计 关联和相关 聚类 优化 (1)描述统计 描述统计是数据挖掘的入门兵器,相对较为直观、简单。描述统计包括平均数、中位数、众数、分位数、百分比等。描述统计经常和统计图(如直方图,条形图,线图,散点图,茎叶图等)配合使用,其应用十分广泛,比如计算公司年平均利润率水平,不同区域销售量的对比等等。 描述统计可用于税收上的行业税负分析、征管基本状况分析、税源构成与分布分析等方面。 (2)关联和相关 关联规则从本质上讲是条件概率,即A发生时,B同时也出现的概率是多大?关联规则的一个典型的现代应用是美国沃尔玛超市的“啤酒加尿布”案例。在应用关联规则时需要考虑的一个问题是:符合这一概率的客户数量有多少?简单地说,假设超市的尿布只有一个人买,而且这人每次买尿布时,一定会买啤酒。尽管这条规则很可信(概率100%),但实际意义却不大。相关也是考虑两个事物之间的关系,典型的度量方法有Pearson相关系数和Kendall相关系数。 关联和相关方法在税收上可用于税种关联分析、计税依据与财务指标关联分析、宏观经济与税收收入分析、税收政策执行效应分析等方面。 (3)分类和聚类 分类的方法主要有三种:回归、决策树、神经网络。聚类和分类的最大区别,就是分类是有监督的,聚类是无监督的。监督就是标准,或者说有目标变量,而聚类是没有目标变量的,不知道每一类有什么特征的,聚后再总结,再发现共同点。 分类和聚类方法在税收上可用于纳税信用等级分析、税收宣传手

文档评论(0)

新起点 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档