- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
去留无意,闲看庭前花开花落;宠辱不惊,漫随天外云卷云舒。——《幽窗小记》
1.信息资源标准化
数据标准化主要实现了数据格式、内容和语义的映射、转换,实现编码一致
化、面向主题集成、数据聚合等功能.
通过数据交换、采集,形成的基础业务数据,通过数据整合进一步的数据
ETL(数据抽取、转换、加载),按照定制的标准信息规范进行匹配映射(Match)、
数据格式转换(Transform),并对重复数据进行数据清洗(Cleanse)、过滤
(Filtrate)、聚合(Aggregate),最后多维加载(Load)后形成标准化数据。
采用数据同步工具和ETL工具完成数据抽取、同步等整合工作,并通过任务
调度管理实现对整合工具的集中管理和执行.
数据采集时可以按信息资源平台的要求将数据标准化。在采集抽取数据时没
有按信息资源平台转换为标准数据的数据,需要按信息资源平台的要求转换成标
准的数据如字典的统一。
2.数据加工管理
2.1.数据抽取
数据抽取是利用抽取工具,建立抽取模型,将多个数据源数据汇总到一个数
据库的过程。
2.2.数据清洗
由于数据来自多个业务系统,而且包含历史数据,需要按照一定的规划把数
据进行清洗,整个数据清洗的对象应包括不完整的数据、错误的数据、重复的数
据等三大类。
去留无意,闲看庭前花开花落;宠辱不惊,漫随天外云卷云舒。——《幽窗小记》
2.3.数据转换
数据转换主要实现数据标准化的过程,信息资源平台的数据,来自多个业务
系统,有些数据源没有按照统一的标准规范设计,因此会造成数据难以与其他数
据共享。数据转换应实现按照统一的数据标准和既定的格式转换规则,对数据的
整理和格式统一。
2.4.数据装载
数据装载操作效率是数据资源平台需要考虑的重要环节.投标人应详细描述
针对本项目的不同数据资源所应采用的数据装载策略。
2.5.数据标识
数据标识主要为了突出数据的关键性信息,便于实时的统计和更有效的比对,
进而获取符合用户业务办理相关的结果。
3.数据整合处理系统
3.1.数据处理流程
数据中心的构建,基础和核心的工作是需要对来自各方的数据进行充分的整
合和处理,对获取的各类源数据,需要进行大量的数据梳理、分析,并作相关的
数据整理工作,通过数据梳理和转换工作,把不同来源的数据基于数据标准,转
换成标准化数据后,再进行入库,从而保证进入数据中心的数据质量,不产生垃
圾数据,从而为数据中心的全局应用奠定基础.
数据处理的流程如下图所示:
数据的处理流程主要如下:
1、获取源数据
去留无意,闲看庭前花开花落;宠辱不惊,漫随天外云卷云舒。——《幽窗小记》
通过数据共享交换对接和实施,获取各单位的原始数据,并暂存在数据缓冲
库中,这部分的数据结构和原始数据的数据结构相同.
2、数据整合处理
对缓冲库中存储的数据,基于数据标准,对原始的数据进行整合处理,包括
企业关键码标准化处理、企业基础数据整合处理、企业许可数据整合处理、企
业监管数据整合处理、其他政府部门数据整合处理、电子统计报表数据导入处理、
历史数据整合处理等。
通过整合处理,把非标准化的原始数据转换成标准化的数据.
3、数据中心数据入库
对整合处理后的数据按照数据的性质,分别进入到基础
文档评论(0)