- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
. .
. .word.
信息资源标准化
数据标准化主要实现了数据格式、内容和语义的映射、转换,实现编码一致化、面向主题集成、数据聚合等功能。
通过数据交换、采集,形成的根底业务数据,通过数据整合进一步的数据ETL〔数据抽取、转换、加载〕,按照定制的标准信息标准进展匹配映射〔Match〕、数据格式转换〔Transform〕,并对重复数据进展数据清洗〔Cleanse〕、过滤〔Filtrate〕、聚合〔Aggregate〕,最后多维加载〔Load〕后形成标准化数据。
采用数据同步工具和ETL工具完成数据抽取、同步等整合工作,并通过任务调度管理实现对整合工具的集中管理和执行。
数据采集时可以按信息资源平台的要求将数据标准化。在采集抽取数据时没有按信息资源平台转换为标准数据的数据,需要按信息资源平台的要求转换成标准的数据如字典的统一。
数据加工管理
数据抽取
数据抽取是利用抽取工具,建立抽取模型,将多个数据源数据汇总到一个数据库的过程。
数据清洗
由于数据来自多个业务系统,而且包含历史数据,需要按照一定的规划把数据进展清洗,整个数据清洗的对象应包括不完整的数据、错误的数据、重复的数据等三大类。
数据转换
数据转换主要实现数据标准化的过程,信息资源平台的数据,来自多个业务系统,有些数据源没有按照统一的标准标准设计,因此会造成数据难以与其他数据共享。数据转换应实现按照统一的数据标准和既定的格式转换规那么,对数据的整理和格式统一。
数据装载
数据装载操作效率是数据资源平台需要考虑的重要环节。投标人应详细描述针对本工程的不同数据资源所应采用的数据装载策略。
数据标识
数据标识主要为了突出数据的关键性信息,便于实时的统计和更有效的比对,进而获取符合用户业务办理相关的结果。
数据整合处理系统
数据处理流程
数据中心的构建,根底和核心的工作是需要对来自各方的数据进展充分的整合和处理,对获取的各类源数据,需要进展大量的数据梳理、分析,并作相关的数据整理工作,通过数据梳理和转换工作,把不同来源的数据基于数据标准,转换成标准化数据后,再进展入库,从而保证进入数据中心的数据质量,不产生垃圾数据,从而为数据中心的全局应用奠定根底。
数据处理的流程如以下图所示:
数据的处理流程主要如下:
1、获取源数据
通过数据共享交换对接和实施,获取各单位的原始数据,并暂存在数据缓冲库中,这局部的数据构造和原始数据的数据构造一样。
2、数据整合处理
对缓冲库中存储的数据,基于数据标准,对原始的数据进展整合处理,包括企业关键码标准化处理、企业根底数据整合处理、企业许可数据整合处理、企业监管数据整合处理、其他政府部门数据整合处理、电子统计报表数据导入处理、历史数据整合处理等。
通过整合处理,把非标准化的原始数据转换成标准化的数据。
3、数据中心数据入库
对整合处理后的数据按照数据的性质,分别进入到根底数据库和业务数据库中。
食品平安监管数据整合处理分析
企业关键码标准化处理
目前,有关企业的各类信息都分散在XX省XX监管平台、网上办事大厅XX分厅以及相关部门的行政审批系统,不同的系统对企业的唯一编码各不一样,目前存在三种方式:
企业组织机构代码
企业工商登记注册号
统一社会信用代码
企业XX行业相关许可证号
由于不同的业务系统是由不同的开发商开发的,在企业编码的标识上各不统一的,为了实现基于企业为主线,首先需要以企业关键码为关联,对各方会聚的有关企业的各类信息进展关联整合,形成企业综合资源,为后续的企业综合分析提供数据支撑。
因此,需要基于企业编码标准,对采集的原始企业业务数据的企业编码进展标准化处理。
企业关键码标准化处理涉及的工作包括:
1、根底数据获取
通过共享交换对接、文件导入等多种方式,获取有关企业的根底数据等。
2、企业关键码梳理分析
根据调研情况,针对XX市企业根底数据的实际情况和国家推行三码合一的政策,采用依次以信用代码、组织机构代码、工商登记注册号、许可证号对从各方获取的企业信息进展梳理分析,和企业关键码进展比对,制定企业关键码标准化的处理规那么。
3、企业关键码数据标准化
对各方会聚的企业关键码数据按照标准化处理规那么进展转换、补充等处理。
企业根底信息整合处理
在不同的业务系统中,对企业根底信息描述有有差异、包括企业字段和相关的数据构造的设计等,因此,需要对各方会聚的企业根底信息按照统一的企业根底数据标准,进展整合处理,构建企业根底数据库。
企业许可数据整合处
原创力文档


文档评论(0)