个税微观模拟业务部分.docVIP

  • 5
  • 0
  • 约9.51千字
  • 约 20页
  • 2018-03-08 发布于天津
  • 举报
个税微观模拟业务部分

招 标 文 件 业务部分 项目名称:个人所得税微观模拟模型项目 项目编号:2017CGSC038 国家税务总局 2017年11月 目录 第一章 项目背景 3 第二章 项目概述 3 2.1 项目建设目标 3 2.2 项目建设内容 3 第三章 系统业务功能需求 4 3.1 功能概述 4 3.2 功能模块业务需求 5 3.2.1 数据管理 5 3.2.2 税改方案模拟 6 3.2.3 改革效应分析 7 3.3.4 系统设置 13 第四章 非功能性需求 14 4.1 一般性技术需求 14 4.1.1 技术先进性需求 14 4.1.2 系统性能指标 15 4.1.3 可扩展性需求 15 4.1.4 易用性需求 15 4.1.5 可靠性需求 15 4.1.6 可维护性需求 16 4.2 项目技术约束 16 4.2.1 应用架构约束 16 4.2.2 构件约束 16 4.2.3 平台约束 17 4.2.4 技术标准和规范 17 4.3 关键功能技术需求 17 4.3.1 分布式数据库需求 18 4.3.2 商务智能展现需求 18 4.3.4投标响应要求 20 第一章 项目背景 第二章 项目概述 2.1 项目建设目标 2.2 项目建设内容 本项目建设内容主要包括样本数据库的构建、有效样本的筛选、模拟测算模型开发以及基于测算结果的分析。 第三章 系统业务功能需求 3.1 功能概述 个人所得税微观模拟分析平台功能,共分为数据管理、税改方案模拟、改革效应分析和系统设置等四部分内容。 (一) 数据管理 数据管理包括数据导入和提取、数据整理、数据储存、数据清洗、样本抽取和数据时化等六项功能。 (二) 税改方案设置 在编写11个税目(34个子税目)的税法计算器基础上,将关键的政策参数设置开放式端口,通过修改相应参数模拟出个税政策改革方案。执行改革方案后,生成的样本数据必须保存运算结果。 (三) 税改效应分析 按给定的条件,查询、统计税改后的税收、税负、居民分配等情况,并与改革前的状态比较,评估改革效果;或多个改革方案比较对比,挑选最佳方案;分析工具要支持基尼系数、K指数、泰尔指数等内置算法。平台设置固定分析表,满足常用分析需要,并要求图表结合,支持数据切片、钻取功能,同时设置自动式分析功能,可满足用户的深度分析需求。 (四) 系统设置 主要包括对系统用户、权限进行设置,对报表格式、报表代码进行维护,以及清洗规则、抽样规则等进行配置维护。 3.2 功能模块业务需求 3.2.1 数据管理 1. 数据导入和提取 用于个人所得税明细数据的导入,应能够支持ORACLE10G/11G导出的DMP格式、EXCEL格式、TXT格式等多种数据文件的数据导入功能;总局集中全国个人所得税申报数据后,应能够支持直接从金税三期核心征管系统提取数据。 2. 数据脱敏 为确保个税信息的安全,导入个税数据后应对个人所得税明细信息脱敏,剔除其中的证件号码、姓名、单位代码、单位名称等敏感信息。脱敏前应根据身份证号码生成出生年月日、性别等信息,用于后续分析。 3. 数据整理 主要是对金三上线前的数据进行整理,确保历史数据全部适用统一的金三规则。包括行业代码规则、地区代码规则、经济类型规则、税目代码规则及其他相关规则。 4. 数据储存 根据税改方案的测算需要,实现明细数据和个人汇总数据的两级储存管理。其中,明细数据是以统一标准格式记录居民每一笔申报数据,主要用于单一税目改革的方案测算,数据量约50亿条/年;个人汇总数据是将清洗后的明细数据库按照个人身份信息进行归集所形成的一人式数据库,主要用于综合征收改革的方案测算,汇总后数据量约5亿条/年。 为适应更多改革方案的需要,数据储存还应具备以下拓展功能:能够在个人身份中增添家庭成员的关联关系,建立以家庭为单位的数据集,以满足家庭联合申报改革方案的测算;能从外部导入个人就业、消费、支出、信贷、不动产等第三方个人信息,建立起完整、连续的自然人数据库,以满足增加扣除项目改革方案的测算。 支持线性可扩展,支持集群部署,满足TB甚至PB级数据查询。 5. 数据清洗 申报数据应进行清洗,剔除垃圾数据,优化数据质量,提高分析结论的可靠性。清洗规则应包括:证件号规则、姓名规则、税法逻辑规则、收入区间合理性规则以及申报频度规则等。 为确保数据清洗可控、有序、留痕,系统应支持整理、清洗转换规则的封装固化,并可便于业务用户调整及扩展,用户只需要简单的配置即可完成数据的整理、清洗、转换。整理、清洗、转换规则应支持数据行级清洗和字段级清洗,行级清洗包含:行记录过滤、去重、抽样等,字段级清洗包含:字段的拆分、分割、合并、替换、格式转换等,清洗转换规则能根据配置规则项自动合并运算,批量处理大幅提升性能。 6. 数据抽

文档评论(0)

1亿VIP精品文档

相关文档