网站大量收购闲置独家精品文档,联系QQ:2885784924

数据整合方案.pdfVIP

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

去留无意,闲看庭前花开花落;宠辱不惊,漫随天外云卷云舒。——《幽窗小记》

1.信息资源标准化

数据标准化主要实现了数据格式、内容和语义的映射、转换,实现编码一致

化、面向主题集成、数据聚合等功能.

通过数据交换、采集,形成的基础业务数据,通过数据整合进一步的数据

ETL(数据抽取、转换、加载),按照定制的标准信息规范进行匹配映射(Match)、

数据格式转换(Transform),并对重复数据进行数据清洗(Cleanse)、过滤

(Filtrate)、聚合(Aggregate),最后多维加载(Load)后形成标准化数据。

采用数据同步工具和ETL工具完成数据抽取、同步等整合工作,并通过任务

调度管理实现对整合工具的集中管理和执行.

数据采集时可以按信息资源平台的要求将数据标准化。在采集抽取数据时没

有按信息资源平台转换为标准数据的数据,需要按信息资源平台的要求转换成标

准的数据如字典的统一。

2.数据加工管理

2.1.数据抽取

数据抽取是利用抽取工具,建立抽取模型,将多个数据源数据汇总到一个数

据库的过程。

2.2.数据清洗

由于数据来自多个业务系统,而且包含历史数据,需要按照一定的规划把数

据进行清洗,整个数据清洗的对象应包括不完整的数据、错误的数据、重复的数

据等三大类。

去留无意,闲看庭前花开花落;宠辱不惊,漫随天外云卷云舒。——《幽窗小记》

2.3.数据转换

数据转换主要实现数据标准化的过程,信息资源平台的数据,来自多个业务

系统,有些数据源没有按照统一的标准规范设计,因此会造成数据难以与其他数

据共享。数据转换应实现按照统一的数据标准和既定的格式转换规则,对数据的

整理和格式统一。

2.4.数据装载

数据装载操作效率是数据资源平台需要考虑的重要环节.投标人应详细描述

针对本项目的不同数据资源所应采用的数据装载策略。

2.5.数据标识

数据标识主要为了突出数据的关键性信息,便于实时的统计和更有效的比对,

进而获取符合用户业务办理相关的结果。

3.数据整合处理系统

3.1.数据处理流程

数据中心的构建,基础和核心的工作是需要对来自各方的数据进行充分的整

合和处理,对获取的各类源数据,需要进行大量的数据梳理、分析,并作相关的

数据整理工作,通过数据梳理和转换工作,把不同来源的数据基于数据标准,转

换成标准化数据后,再进行入库,从而保证进入数据中心的数据质量,不产生垃

圾数据,从而为数据中心的全局应用奠定基础.

数据处理的流程如下图所示:

数据的处理流程主要如下:

1、获取源数据

去留无意,闲看庭前花开花落;宠辱不惊,漫随天外云卷云舒。——《幽窗小记》

通过数据共享交换对接和实施,获取各单位的原始数据,并暂存在数据缓冲

库中,这部分的数据结构和原始数据的数据结构相同.

2、数据整合处理

对缓冲库中存储的数据,基于数据标准,对原始的数据进行整合处理,包括

企业关键码标准化处理、企业基础数据整合处理、企业许可数据整合处理、企

业监管数据整合处理、其他政府部门数据整合处理、电子统计报表数据导入处理、

历史数据整合处理等。

通过整合处理,把非标准化的原始数据转换成标准化的数据.

3、数据中心数据入库

对整合处理后的数据按照数据的性质,分别进入到基础

文档评论(0)

155****4905 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档