建立模型应该考虑几个问题教材.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
建立模型应该考虑的几个问题 数 据仓库建模质量直接影响数据仓库项目的质量,甚至成败。在进行建模之前,要对数据仓库的规模、组成及模型不同部分的功能定位有明确的定义。影响数据仓库建 模的因素众多,且根据不同项目的具体情况而变化口下面的几个问题是较为通用和常见的,远远不是建立模型应该考虑的全部问题。 数据仓库的业务特点对建模的要求 1 数据仓库的数据组织是面向主题的,而不是面向报表的 数据仓库是面向业务分析的主要主题领域的,进行形成数据模型的定义。典型的主题领域主要包括: · ·顾客购买行为 · ·产品销售情况 · ·企业生产事务 · ·原料采购 · ·合作伙伴关系 · ·会计科目余额 要 对现有的报表需求进行细致的分类、分析和调整,不能为了实现单个报表而进行大量的建模工作。要根据分析的不同内容和主题对报表进行分类,明确报表中每一个 数据的定义、统计口径及不同数据之间的关系,建立在整个数据仓库内统一的数据指标的定义,将数据指标按分析主题及分析维度进行归集,从而形成面向主题的数 据模型。 例如:我们的利润表报表,当业务部门发我们一个利润表 的报表,作为需求时,我们应该进行细致的分析,最终我们确定我们面向的主题不是利润表,而是比利润表更大的一个层次的所有科目业务量的主题,这样我们在做 别的报表,例如资产负债表,现金流量表等报表时,就不用重复建模的工作了,做到了软件工程中的可重用规则。 2. 数据仓库要实现对数据的集成与数据的同构性 3. 数据仓库数据的相对稳定与为实现应用而进行的实时读写操作 往数据仓库里实时写数据就是不可避免的, SAP BI 也提供支持这种处理的数据对象,如实时信息立方体、汇总级别等,并提供相应的管理机制保证数据的一致性。在建模的时候要好好考虑只读的对象与可写入的对象之间的关系。 4. 数据仓库反映历史变化与及时准确的数据处理能力 数据仓库的数据库设计原则的要求 1. 星形结构,实现简明的数据设计模式 2. 数据参照完整性,保证数据的一致性 3. 利用索引,提高查询的处理速度 4. 先去索引、后加索引,提高数据装载效率 5. 自动校验,保证数据的高质量 SAP 商务智能项目实战过程和方法 收集客户需求信息 1. 组织结构 2. 客户最需要分析的数据指标 3. 数据指标的数据来源 4. 对数据指标的多维分析对象 5. 数据指标的优先级 6. 权限要求 收集客户需求的方法 1. 面谈 2. 问卷调查 3. 报表样例分析法 分析客户需求,形成多维分析模型(逻辑建模) · 实体-关系模型 · KPI与分析维度 一 般情况下主题和属性之间的关系是一对多的关系,通过诸多属性的描述,可以得到客户等对象的最详细的信息。但是有些情况下,也有存在多对多的情况,如一个产 品有多个颜色等,这种情况下,我们设计时,要把他们作为独立的两个特征同时出现在维度表中,也是视实际的关系采用组合属性,时间相关的属性等方法。如例子 中的一个人在不同的时期属于不同的地区,这就是多对多的关系,所以采用了时间相关的属性。 将逻辑模型变成物理模型 利用业务内容(bi content)加快建模进程。 直接从系统中现有的模型来建模和扩展。 多层逻辑模型与BI中的建模技巧 对于大型的数据仓库系统,简单的数据获取、存储及展现的架构是远远不能满足需求的。 大型数据仓库项目的建设,需要对将数据仓库中不同数据的功能与定位进行细分,根据其功能不同,分别采取各种建模方面和技术方面的性能优化措施。 企业数据仓库与数据集市 在企业级的数据创建建设方法上,存在着两种不同的建设思路。其实这两种建设思路并不是绝对对立的,利用SAP商务智能的配置功能,可以构建更为灵活的多层次的数据仓库结构。 1.两种建设数据仓库的不同思路 一 种是有Inmon提出的企业级数据仓库模型。主张采用第三范式(3NF),先建立企业级数据仓库,再在其上开发具体的应用。其优点是采用了第三范式,数据 存储冗余度低、数据组织结构型好;同时反映的业务主体能力强,具有较好的业务扩展性等。这种建设思路不足的地方时数据表是数据表之间的联系比较多,也比较 复杂,跨表操作多,查询效率较低。由于数据模式复杂,不容易理解,不利于维护。系统建设过程长,周期长,难度大,风险大,容易失败。 另 一种思路是有Kimball提出的多维模型。他主张降低范式化,以分析主体为基本框架来组织数据。其优点是以多维模型开发分析主题,查询速度快,做报表也 快,同时可以实现快速实施,迅速获得投资回报。再在各个分析主题的基础上循序渐进,逐步建成企业级数据仓库。这种主张融合了自下而上和自上而下两种设计方 法的思想,但是需要对数据进行大量的预处理,建模过程相对来说就比较慢。由于数据是按业务主体组织的,当业务问题发生变化,维的比搬动复杂、耗时,而且信 息不够全面、系统欠灵

文档评论(0)

189****6140 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档