- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
老当益壮,宁移白首之心;穷且益坚,不坠青云之志。——唐·王勃
生态环境数据治理和分析服务技术方案
(一)数据治理服务
1、规范数据工作
A(I)持续对新接入/共享的数据、接口进行梳理,按照国家回流、内部归集、市州上
报、横向共享、跨省共享、外部采集等维度,梳理生态环境厅新接入/共享的所有数据,
最终形成体系完整、架构清晰的数据、接口清单,并持续维护。数据清单可以表格、导图
等形式体现。
▲(2)持续对接入数据源头进行梳理,对数据来源的类型、更新频率、地址、端口、
用户、密码等进行梳理,形成文档并持续进行更新。
▲(3)持续对数据共享对象进行梳理,对目标的类型、共享频率、共享方式等进行
梳理,形成文档并持续进行更新。
A(4)持续对数据加工任务进行梳理,梳理数据流向,对数据来源、各个层级中间表、
结果表进行映射,并形成文档。
A(5)对新增数据调度任务进行梳理,基于中台工具,梳理调度任务的数据源、调度
频率、调度依赖关系、产出物等,形成文档,提高数据调度效率和准确性。
▲(6)对数据指标与统计口径进行梳理,梳理各类共享、加工任务,梳理各类指标
对应的统计口径,包括清洗治理过程、数据血缘关系等,形成文档等可见成果。
A(7)规范数据治理流程并形成文档,同时围绕环境业务数据,提供5类及以上环境
质量及污染源数据质量规则。
▲(8)提供详细的数据治理工作方案,对四川省生态环境厅数据治理要求、治理内
容、现有问题以及下一步工作进行详细描述。
2、强化数据支撑
A(I)数据采集
1)采集范围
根据实际工作要求,对接各类外部数据并进行接入,包括但不限于国家、市州、外
老当益壮,宁移白首之心;穷且益坚,不坠青云之志。——唐·王勃
部厅局等数据,并持续更新维护外部数据的相关信息,保障外部数据接入持续、稳定开
展。
2)采集方式
充分利用数据中台现有的结构化数据、非结构化数据以及时序数据的采集功能,开
展数据采集工作。对采集策略进行配置管理,包括采集策略的添加、修改、删除和查询
操作,生成采集任务,并由任务调度管理模块进行集中调度控制。
3)数据清洗
在数据采集时进行基本的数据清洗,根据数据实际情况自定义规则,发现与解决在
数据抽取过程中可能产生的异常错误信息。
▲2)
(数据加工
1)工作范围
完成各类专题数据的优化与加工,包括大气、水、排污许可证、环评、监测等数据
的优化与加工。
完成日常业务处室数据需求,提供实时数据、离线数据加工能力,提供结构化、非
结构化数据的加工能力,形成各类数据成果并及时反馈。
完成各类临时需求任务,包括部级上报数据、横向厅局共享数据、市(州)回流数
据、各类外部数据的加工等。
2)加工方式
(ODSDWD.TDS
基于数据中台整体数据架构、等),将处理后的数据进行关联,形
成中间表、结果表并分层进行存储;梳理数据链路,明确数据流向。
3)数据标签
根据生态环境业务处理规则,新增各类标签,并在对应的数据层进行存储。支持标
签分类管理,基于标签的类目管理功能,进行长期的维护与更新。
▲(3)数据
文档评论(0)