电子商务BI中的基础思考.pptVIP

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
不要过度将BI神化 好像现在大家都在说BI,也很关注BI了。 甚至跟数据没啥关系的也都扯上BI分析,其实完全没必要。 我一直认为BI的理念是好的,让大家认识到数据的价值,遵循数据说话、科学决策的思想。但要说通过BI一下子让企业竞争力提升,超越竞争对手是不可能;只能是逐步实施BI的过程提升大家决策的科学性,同时改进生产环节的细节问题,增强管理的规范程度。只能锦上添花,不能雪中送炭。 而且真正要把BI做好也是不容易的,既要考虑做好基础性工作,又要考虑业务的需求,还需要进行长远地规划,最重要的是能够使BI的数据结果能够应用到日常生产中,所有的分析、挖掘都是为企业运营服务的,单纯为了BI而BI,没有任何意义。 Bobby Luo 罗如意189.cn) 2011年7月 /cquptvlry Bobby的Senior BIer之路之二 对于BI认识的两个误区 BI是一个完整的体系 架构规划的实例 如何分阶段实施 关于数据质量的思考 BI到底是什么? BI已经是现在很流行的概念了(从数据获取信息,产生价值)。 但到底什么是BI?应该怎么样实施? 误区一:BI就是报表和取数 1、在生产系统之外,建立单独的报表库及报表系统,需要时就开发一些特定的报表,或者手工提取数据,再做一些简单分析。 2、一般的需求由业务部门如市场部、产品部发起,BI部门沦为简单的数据提供部门。 带来问题:业务部门一般都是从自己部门角度考虑,同时缺乏对其他部门数据和BI技术的了解,分析一般比较狭窄。而BI部门疲于应付各种取数和开发需求,缺乏对高级BI应用的开发和对整个企业BI分析的规划。 误区二:数据挖掘等高级应用才是BI 1、很多人尤其是领导者一般很容易被现在流行的BI概念所影响,认为只有数据挖掘、精准营销这些相对高级一点的应用才是BI。 2、从而很关心每月做了多少个挖掘或分析,而不愿意做一些基础性的数据整合、模型规划等工作。 带来问题:应用很多,但都是浅尝则止,没有真正地给企业带来多大实际价值。同时应用开发的效率低下,很多数据每个人重复地计算来计算去,结果却各不一致。数据质量问题也影响了分析和挖掘的结果及应用价值。 对于BI认识的两个误区 BI是一个完整的体系 架构规划的实例 如何分阶段实施 关于数据质量的思考 BI是一个完整的体系 数据源 业务用户 ETL 数据集市 抽取 转换 清洗 加载 查询 报表 OLAP 数据 挖掘 数据仓库 信息访问 网络管理 数据库管理 系统管理 元数据 逻辑数据模型 物理数据模型 业务和技术咨询与培训服务 中间件/EAI 可选项 整合的数据基础 良好的层次体系 长远的应用规划 恰当的最终展现 + + + 一、要有整合的数据基础 二、要有良好的体系规划及运维机制 三、要结合业务需求做好应用规划 四、需求出发、各尽其用 对于BI认识的两个误区 BI是一个完整的体系 架构规划的实例 如何分阶段实施 关于数据质量的思考 公司的现状 需要考虑的几个关键问题(1/3) 1、是否需要将Oracle数据和应用全部迁移到Teradata? 否。 Teradata是单节点,如果全部迁移到Teradata,随着数据和应用增加迟早也会遇到性能和存储瓶颈;而且现在ORACLE已经有大量的脚本和报表,如果全部迁移的话,需要花费大量精力,数据核对也很复杂。 2、哪是否形成两套独立的系统?老的保留,新的应用全部基于TD。 否。 这样仍存在Teradata瓶颈问题。同时需要维护两套不同的ETL系统,工作量增加,两套系统间的数据一致性也会存在很大问题。 因此最好的方法是充分利用现有Oracle的ETL和汇总数据,形成Oracle和Teradata整合的体系架构。 Teradata和Oracle结合的EDW体系 Oracle 生产库/备库 报表系统 Teradata Hadoop 分析与挖掘 轻度汇总表 明细数据 整合数据 应用层模型 明细数据 轻度汇总 1、Oracle作为Teradata的主要数据来源,负责对原始数据进行清洗整合,并生成轻度汇总表。之后将清洗整合后的数据送给TD做汇总处理。 2、报表分为两类,明细报表主要从Oracle产生,汇总报表则来源于TD数据仓库。 好处:1、综合利用Oracle的OLTP处理优势和TD的OLAP优势,分散处理,避免单一系统瓶颈。 2、可保证数据的一致性。 3、用Automation统一维护和监控ETL过程。 4、最大限度保留已有的脚本和程序,保护投资,减少重复工作量。 明细报表 汇总报表 * 参考了电信IT体系中的ODS系统 需要考虑的几个关键问题(2/2) 3、怎样保证基础建设和应用开发的平衡?

文档评论(0)

sheppha + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5134022301000003

1亿VIP精品文档

相关文档