企业数据模型设计方法论探讨.docx

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
企业数据模型设计方法论探讨

企业级数据模型设计方法论探讨 引言 数据模型设计是一个老生常谈的话题,在以往的数据仓库BI项目中,数据模型的方法论、概念通常大多围绕如何设计和建设数据仓库,而应用系统(OLTP系统)模型设计却缺乏方法论的指导,加之各应用系统通常都是由不同厂商在不同时期自行设计开发,彼此之间缺乏沟通,导致数据分散重复、口径不一致和数据兼容性差。由于数据仓库在企业整体信息化规划中属于下游系统,只能被动接收由各应用系统产生的数据,数据入仓之后,由于口径不一致、兼容性差,给数据整合带来极大困难。企业在投入大量的人力、物力和资金推进信息化建设,仍然出现大量的“信息孤岛”现象。 本文认为,企业信息化建设的成功很大程度上取决于系统模型的合理性和不同系统间概念的一致性,而企业级数据模型是企业信息化的核心问题,通过企业级数据模型定义整个企业信息化体系的数据标准,逐步统一企业内部数据标准,指导各应用系统数据模型统一设计,可以从根本上保证系统之间数据的兼容性和一致性,消除由于各应用系统自行设计开发而导致的数据分散重复、口径不一致和信息孤岛现象,推动企业内各类应用系统的整合和数据的共享,全面提升经营决策、运营管理、业务拓展和客户服务等方面的支撑能力。 本文将首先阐述企业级数据模型的定义和结构,分析其业务价值。通过描述企业级数据模型与应用系统模型间关系,划分两者之间的概念边界和区别,从而更好的理解企业级数据模型的真正内涵。其次,阐述了企业级数据模型设计的基本方法和关键要点,使读者能够掌握企业级数据模型设计的整体思路,以便对后续工作提供借鉴和指导作用。最后,总结了多个项目的经验教训,分享企业级数据模型建模过程中的心得体会,希望对大家能有所帮助。 企业级数据模型定义 2.1模型基本定义 企业级数据模型不能等同于数据仓库模型,企业级数据模型是站在整个企业业务的视角,对企业全部数据(包括生产数据和消费数据)全貌性、整体性描述。企业级数据模型是业务人员和IT人员进行沟通的媒介、也是企业内部与外部进行交流的纽带。 企业级数据模型是一种建设蓝图,它识别了企业内部跨功能、跨部门、跨组织的共享或冗余数据,为系统的规划、设计和实施提供一种可视化方式和支撑框架,是企业内部所有应用系统数据模型设计的起点,如ODS、EDW等系统的设计开发,有助于促进数据整合、消除数据孤岛和遗留系统保持一致。 企业级数据模型是一个数据集成定义,它不依赖于企业内部某个具体的系统或应用,也跟数据的物理实现无关(包括数据如何获取、如何存储、如何处理以及如何访问)。 2.2模型结构 企业级数据模型可分解为三个层级:主题域模型、概念模型和逻辑模型。三个层次模型逐级扩展。企业级数据模型的创建更是一种艺术而非一门科学,应集中企业的集体智慧,共同推进企业级数据模型的不断完善。 2.2.1主题域模型 企业主题域模型在企业级数据模型中处于第一层次,其覆盖原则是“有需求才覆盖”,一个企业的平均主题域数量通常在10~20之间。 主题域模型内涵 主题(Subject)是在较高层次上将企业的数据进行综合、归类和分析利用的抽象概念,每一个主题通常对应一个宏观的业务分析领域。 主题域是对某个主题进行分析后确定的主题边界。典型的主题域包括参与人、产品、协议等。 主题域模型处于企业级数据模型的顶层,是针对企业关键业务领域、业务概念的分类方法和框架。 主题域模型特征 看似简单的主题域模型实际上凝聚了企业内部中高层管理者的共识,因而需要耗费较长时间进行充分的沟通和交流; 主题域模型的价值在于企业内部对业务的理解深度,以及体现企业内部各方达成的协议。 2.2.2概念模型 企业概念模型在企业级数据模型中处于第二层次,将每个主题域进一步细分为“概念”,通常每个主题域包括10~20个“概念”。企业概念模型由概念以及概念之间的关联关系组成。 概念内涵 “概念”是对主题域、主题域范围的进一步定义和细化 ; “概念”描述了企业生产和消费的核心业务信息,独立于具体的实现问题和细节 ; “概念”应基于企业的主要业务,应由企业主要业务驱动“概念”定义; “概念”的要点在于表现企业重要的业务视角,而不是数据量的大小; “概念”还需考虑行业的适用性,如包括供应商、合作伙伴以及外部引用数据的概念。 概念模型特征 概念模型是一种高阶数据模型,以实体—关系(Entity-RelationShip,简称E-R)理论为基础,通过主题域形式描述概念化的结构; 概念模型是对主题域模型的进一步细化。 概念模型定义了企业内主要业务实体及实体间的业务关系。 概念模型不描述业务实体的数据属性 实体之间可能存在多对多关系,不对数据进行范式化处理。 2.2.3逻辑模型 企业逻辑模型在企业级数据模型中处于第三层次,并将每个概念进一步细分为“逻辑实体”。企业逻辑模型由逻辑实体、业务主键、关联

文档评论(0)

shenlan118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档