- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
元数据解决方案
随着报价系统每年收集和使用的数据飞速增长,数据体量日趋增长,数据形态多样化且不统一,多种数据源之间的采集、传播和共享遇到困难。元数据管理作为大数据治理的核心,是有效管理这些数据的基础和前提,在信息化建设中发挥着重要的作用。如何理解、管理并发挥出元数据的价值,成为迫切的任务。
什么是元数据
元数据(Metadata)是关于数据的数据。元数据是描述数据仓库内数据的结构和建立方法的数据。可将其按用途的不同分为两类:技术元数据(Technical Metadata)和业务元数据(Business Metadata)。
技术元数据
技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据,它主要包括以下信息:
数据仓库结构的描述,包括仓库模式、视图、维、层次结构和导出数据的定义,以及数据集市的位置和内容。
业务系统、数据仓库和数据集市的体系结构和模式。
汇总用的算法,包括度量和维定义算法,数据粒度、主题领域、聚集、汇总、预定义的查询与报告。
由操作环境到数据仓库环境的映射,包括源数据和它们的内容、数据分割、数据提取、清理、转换规则和数据刷新规则、安全(用户授权和存取控制)。
业务元数据
业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使业务人员也能够“读懂”数据仓库中的数据。业务元数据主要包括以下信息:
使用者的业务术语所表达的数据模型、对象名和属性名。
访问数据的原则和数据的来源。
系统所提供的分析方法以及公式和报表的信息。
企业概念模型、多维数据模型,业务概念模型与物理数据的依赖,
元数据的作用
元数据可以实现业务模型与数据模型的映射,帮助用户理解数据仓库中的数据;元数据清晰的描述了数据的来龙去脉,描述了数据抽取转换规则,是保证数据质量的关键;元数据管理系统可以把整个业务的工作流、数据流和信息流有效的管理,可以支持需求变化,从而提高系统的可扩展性;打通数据孤岛,统一数据定义,形成企业级知识传承平台,元数据管理使得数据变的更有价值。
元数据管理
在大数据时代的背景下,数据即资产,元数据实现了信息的描述和分类的格式化,从而为机器处理创造了可能,它能帮助企业更好地对数据资产进行管理,理清数据之间的关系。元数据管理是企业提升数据质量的基础,也是企业数据治理中的关键环节。元数据管理不当,信息很容易被丢失,进而不能对业务进行有效支撑,企业内部业务人员要识别相关信息就会变得十分困难,最终用户也将失去对数据的信任。
元数据采集
技术元数据的采集,根据现有元数据设计出元模型,然后将数据仓库系统之中的元数据按元模型集中汇总并关联到一起,达到企业对数据统一管理与应用的目的,ETL等产生的元数据,对于元数据管理工具支持的格式可直接进行导入,对于一些自定义的规则,需要进行格式转换并导入。
业务元数据相对复杂,来源较广泛且不统一,需要对业务系统进行深入理解,按业务主题进行整理,梳理出业务范围、业务名称 、业务定义、业务描述、业务关系等,并添加到元数据管理系统中。主要从以下几方面来进行梳理:
业务平台中的各业务流程。
交易、结算系统,提取出各种财务公式、过程逻辑、业务规则等。
报表系统,比如表头,包含合计、平均数等聚合函数的列,一些计算公式等。
表格,在Excel中进行业务计算的公式,列的描述、代码描述等。
文件数据中的标题、作者、时间、内容主题等。
存储管理
对元数据存储需要使用专门的工具,拟定为(还需要做充分调研)Pentaho Metadata进行存储管理。通过工具与数据库系统的对接,将元数据导致进去,对于不支持系统对接的元数据,可手动进行添加。通过管理工具提供的辅助功能可对元数据进行标注、完善等。
元数据应用
通过元数据管理工具将元数据服务提供给所有业务人员,使业务人员也能够快速的从业务角度理解数据,从而帮助业务人员更好的利用数据。以下用三个方面来阐述元数据的实际应用价值:
元数据对比分析
业务系统由开发环境到测试环境再到生产环境,在系统的设计、开发、测试、上线过程中,无论需求变更还是Bug都会导致元数据的改动。大到库表结构重新设计,小到字段类型的变更,都可能导致系统出现重大问题。为了避免这种问题的发生,我们可以使用元数据系统的对比分析功能,元数据系统可以自动采集三个环境的库、表、字段、视图、存储过程等结构,自动化采集保证了各自环境中都是最新的、最准确的元数据结构,我们对上线的数据环境与测试库进行对比,会轻松的发现问题所在,能大大降低这些问题发生的概率。
数据流向分析
数据平台系统中,业务数据由操作型数据几分析型数据转换,通过大量的数据抽取、转换、清洗等过程形成了分析统计数据。数据由业务系统-数据仓库-数据集市-分析报表,数据加工链路比较长,期间处理方式多元化,很容易会出现数
您可能关注的文档
- 人教版小学语文三年级上册《科利亚的匣》PPT课件.ppt
- 人教版小学语文三年下册《荷花》ppt课件.ppt
- 人教版小学英语三年级下三单元课件.ppt
- 人教版小学语文三年级上册《小摄影师PPT课件.ppt
- 人教版小学语文五年级下期末总复习课件.ppt
- 人教版小学语文年级上册作文复习.ppt.ppt
- 人教版小学语文三级上册《花钟》PPT课件.ppt
- 人教版小学语文二年级下册:句子段落练习题.docx
- 人教版小学语文五年级册第四单元复习资料.docx
- 人教版小学语文年级下册根据课文内容填空.doc
- 新型四元氧化物压电晶体:构效关系解析与生长技术探索.docx
- 江苏高技术产业化:现状剖析、问题审视与对策构建.docx
- 基于DSP平台的自适应小波变换图像扩频数字水印技术的实现与优化.docx
- 近红外荧光活体成像系统靶点三维定位方法的创新与实践.docx
- 在建热电厂作业人员不安全行为影响因素剖析与应对策略.docx
- 大坝安全监测中无线传感器网络路由协议的优化与应用研究.docx
- 西峰长8油藏开发早期高含水井治理技术:挑战与突破.docx
- 青岛VTS公共服务能力提升路径探索:基于多维度视角与实践案例.docx
- 基于AE的城乡土地利用规划集成信息系统构建与实践.docx
- 稀土硫氧化物红色长余辉材料:制备工艺、性能优化与应用前景.docx
最近下载
- 1安全生产基础档案管理制度、2安全生产责任目标考核奖惩制度、3手残事故应急处置制度、4道路交通安全事故处理报告制度.docx VIP
- 第十章 施工放样测量.pptx VIP
- 2025年邯郸市疾病和预防控制中心人员招聘笔试备考题库及答案解析.docx VIP
- 旧房加固与改造施工方案探讨.docx VIP
- 施工测量放样培训课件.pptx VIP
- YB∕T 4001.1-2019 钢格栅板及配套件 第1部分:钢格栅板.docx VIP
- 施工测量放样(复核)记录表.xlsx VIP
- 施工放样记录表.xls VIP
- YB∕T 4858-2020 用后耐火材料回收利用技术规范.pdf
- 施工放样测量记录表(带计算程序).xls VIP
文档评论(0)