- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
加权计分
算法描述:
将各指标赋予一定的权重,乘以指标预警系数计算异常得分,将评估对象所有指标的异常得分相加得到该纳税评估对象的最终异常得分。(详细评估指标见指标体系)
总得分= ∑指标权重*指标预警系数。
例:
指标预警系数
指标类型(权重W) 异常(5分) 预警(10分) 税负类(w=1) 5分 10分 申报财务类(w=1.2) 6分 12分 发票类(w=1.4) 7分 14分 外部信息类(w=1.6) 8分 16分
贝叶斯
贝叶斯分类判断模型是一个统计分类器,能够预测类别所属的概率,如:一个数据对象属于某个类别的概率。贝叶斯分类判断模型是基于贝叶斯定理而构造出来的。对分类方法进行比较的有关研究结果表明:简单的贝叶斯分类判断模型在分类性能上与决策树和神经网络是可以比的。在处理大规模数据库时,贝叶斯分类判断模型表现出较高的分类准确性和运算性能。
在纳税评估贝叶斯判断分类模型中,是从综合指标分析和行业指标分析两个方面来进行是否遵从税法的分类预测。模型分析基础字段可来自于数据仓库内的所有指标。目前,综合分析指标包括了申报表信息核对、税基发票信息核对、税负比较、往来款项与收入变动率比对、税金工资比率变动、职工薪酬与现金流出核对、总资产周转率分析、毛利率变动比对、存货余额分析、管理费用变动比率、非货币性资产投资分析、资本公积变动分析、留存收益变动分析、预提费用余额分析、应缴和申报的城建税比对、应税资源销售数量变动比对、营业收入变动率和资源税变动率比对、评估期申报资金账簿印花税税额与评估期实收资本、资本公积的增加数应纳税额的比对、评估期累计房产税与上期累计房产税比对、固定资产变动率与房产税变动率比对、DS3.0系统登记房产面积与外部信息的比对、评估期申报缴纳车船税额与上期申报缴纳车船税额比对、应缴与申报的土地使用税的比对、评估期申报缴纳土地使用税与上年同期申报缴纳土地使用税比对、无形资产变动分析等25个通用类指标。
训练样本集合:为了估计各类别的事前概率,需要具有训练样本集,以征管信息系统数据库中各企业的各项各年分析指标和当年是否有偷逃税行为记录为类别属性,作为目前预测分析的训练样本集,以后各年可以随着训练样本集中样本量的增大而使得分析计算基础变得更加接近于实际状况。
分析周期设定:根据所使用指标的获取周期,可以分别提取数据库中使用有关指标的最短周期或最短周期的整倍数,按照月、季、半年、年作为不同的分析周期,主要分析周期为:1年。
基本操作方法如下:
1、每个企业是一个样本记录,均是由一个n维特征向量X来描述其n个属性的具体取值;
2、存在3个不同类别Ci,(i=1,2,3),给定一个未知类别的企业数据X,分类器在已知X的情况下,预测X属于事后概率最大的那个类别,即将X归类到Ci,当且仅当P(Ci│X) P(Cj│X) 对于1≤j≤m,j≠i;其中,事后概率为
3、各类别的事前概率一般可以通过P(Ci)=Si/S进行估计,其中,si为训练样本集合中类别ci的个数,s为全部训练样本集合的大小;
4、根据所给定的包含多个属性的数据集直接计算事后概率的运算量很大,为实现对事后概率的有效估算,通常假设各个类别之间是相互独立的,即各属性的取值是相互独立的,对于特定的类别,则有:,可以根据训练样本估算值;
5、为预测一个未知样本企业X的类别,可以对每个类别Ci估算相应的P(X│Ci)P(Ci),进而确定样本归属类别(P(X│Ci)P(Ci)大者为预测类别)。
效能位差
以上述模型为基础,基本思路就是:1.分别测算税源质量和税负水平,对两项指标分别排序定位,然后计算各样本的位差;2.统计样本位差分布,并根据位差分布情况确定预警标准;3.根据预警标准,对样本逐一检验评估,筛选预警评估对象。
税收效能位差测算:
是指计算各样本税源质量排序序号与税负排序序号的差异。这种差异反映不同样本的纳税能力与税收征收效果的对比关系,是评估税收缴纳状况重要的参考指标。当税收效能位差等于0时,是指一个地区税收贡献排序与其纳税能力排序相等,表明税收实际征收效果与税源质量相匹配;当税收效能位差大于0时,即正位差,表明一个地区税收贡献排序相对靠前,税源质量排序相对靠后,整体征收效果较好;当税收效能位差小于0时,即负位差,表明一个地区的税收贡献排序相对靠后,税源质量排序相对靠前,整体税收效果较差。
位差分布测算:
位差分布测算是指对各样本实际位差分布情况的统计测算,观察各样本位差指标的离散情况。理论上讲,如果实际征收情况等于纳税能力时,各样本的位差都等于零,这时均值为零,标准差也为零。但现实工作中,各样本的实际征收数不会完全等于纳税能力,不可避地会出现位差,这就需要测算其位差分布,为判断合理分布区间提供参考数据。
预警位差的确定:
预警位差要根据位差的离散系数来确
文档评论(0)