- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据深圳视界信息技术有限公司
八爪鱼·大数据 文档编号:BZY2016722
八爪鱼·大数据
深圳视界信息技术有限公司
深圳视界 版权所有
八爪鱼·大数据 文档编号:BZY2016722
税务行业解决方案
一、项目背景
随着互联网的发展和信息数据的爆炸式增长,税务部门对互联网信息的采集、各
方数据的深入调和匹配、内外数据的关联和互动提出了更高的要求。因此如何获取互
联网和第三方的涉税信息并挖掘其中的价值,成为了税务部门较为迫切的需求。
税务部门的各项工作开展需要强有力的数据支撑,需要全方位多维度识别漏征漏
管户,提高补查税款能力,提高涉税风险识别、风险监控、风险预警、风险趋势分析
能力。
二、解决方案
八爪鱼数据采集系统采用分布式云构架,联合客户要求,整个系统部署在腾讯云
平台之上。整个系统包含主程序、监控程序、采集规则配置客户端、分布式采集集群
和存储集群。
主程序实现任务负载均衡分发,采集集群实现多类别、多站点同时并发采集,采
用先进高效的采集技术,采集过程高效准确。存储集群可存储半结构化和非结构化的
数据,具有高容错性、高可用性。
深圳视界 版权所有
八爪鱼·大数据 文档编号:BZY2016722
监控程序提供一个“一站式”人机交互界面供系统管理人员使用。功能包括服务
资源管理、节点资源管理、任务控制及监视。
采集规则配置客户端通过模拟人工网页浏览操作,可视化轻松制作采集规则流程,
无须编写代码。采集规则配置数据存储在一个配置数据库中。
实现对互联网目标信息源(电商、房产、土地、商演、企业经营、行政监管、金
融、本地生活、社交网站,新闻、采购、税务政策等数据)各类碎片化信息的实时采
集、采集信息源覆盖全世界各类税务相关网站,各类公开数据源,税务指定网站,频
道,页面的税务领域的信息,为决策提供数据基础。
提供数据的导出接口,向外部系统提供数据导出功能,补充数据来源。
实现7×24 小时循环信息数据的采集、增量的信息采集,全网采集、定向采集、
智能提取形式结合。
实现上市公司年报PDF 文件涉税数据解析采集
实现对电商平台网站图片涉税数据识别采集
三、客户效益
提高税务部门风险评估的数据支撑,丰富数据来源,提升互联网税源管理能力,
充分利用大数据技术,采集互联网及第三方的数据丰富知识库来源与提供舆情监测。
建立一个先进、高效、稳定的第三方数据采集系统。
一是构建基于大数据的数据采集处理系统,实现互联网数据采集。采集互联网数
据补充风险管理评估,提升监控分析效果。
二是实现非结构化数据梳理分析,通过分布式文件架构提升数据分析加工能力。
三是承担综合治税数据交换运维开发的相关任务。
四是负责核心征管数据的整合和运维。
深圳视界 版权所有
八爪鱼·大数据 文档编号:BZY2016722
微信服务号
深圳视界信息技术有限公司
公司地址:深圳市南山科技园中区科研路9 号比克科技大2401B
产品网站:http ://
商务咨询电话:0755-865202010
商务合作电话
深圳视界 版权所有
文档评论(0)