- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
----宋停云与您分享----
----宋停云与您分享----
itpub 数据仓库论坛版主 innovate51 谈 BI 建模: 为 BI 开个好头--数据模型构建概要
BI 的 数据模型抽象过程,是对业务过程的再梳理,将线性的数据流,改造成
多视角的立体数据。那么有了数据模型的强大支持,数据分析才有了足够发挥空间, 数据分析之后就是 BI 的应用。在数据分析阶段,用户可以介入很少,就是提出分析的方向,由分析人员根据分析方向自由发挥,在 BI 应用阶段,则需要用户全程加入。
传统的数据模型中,都是以常规的维度和事实来描述事务,这种模式下,BI 应用要分析得更加深入,往往需要 BI 分析人员将 DW 的原始数据抽取出来(经过清洗整合的数据还是比业务源数据好得多),然后自己再加工处理。这样既增加了数据分析的难度,也增加了成本和风险。
观察一下多少 BI 分析是这样操作的,你就应该知道数据模型是否需要改进,反正我是这样判断的,如果有满足不了分析的数据模型,我就会考虑模型再造,既是对公司 BI 的负责,也是自己的提高。我想包括很多 XX 牛项目,也存在这样的情况吧,只不过如果分工很细的话,数据仓库的数据模型再造较难推进,随着当前企业多业务交错融入,好的数据模型越来越难以设计。
如果对数据模型再造,来改进 BI 的现状,就要再深入理解业务,可能需要抽象出新视角、新的维度,以及新的指标,来辅助数据分析更加深入透彻。
例如我在构造电子商务数据模型的时候,不会依据电子商务 5 大数据源来构建数据模型,而是依据电子商务业务本身来划分专题、专题之间的相互关系等,构思出了客户访问生命周期模型、客户订单生命周期模型、客户生命周期模型、商品生命周期模型四大类,而且四大模型之间的影响关系也非常清晰,从这四大模型之中,完全看不到任何业务数据源的影子。
而在实体商企业中,商品生命周期模型,可以作为企业级生命周期的一部分, 作为数据集市构建,这样避免重复开发,也能满足电商的特殊性。作为品牌商经营, 这几大模型就足够了,不过如果作为零售代理商或电商平台商,还需要有商品竞争
----宋停云与您分享----
----宋停云与您分享----
对比模型,而品牌商有自主定价权,这类分析重要性没那么大,主要在渠道特点的分析上。
如果我们的数据模型是根据业务系统的表结构来构建,那就只相当于有个物理模型,因为业务系统的业务数据都是线性的,无法直接拿来有效地分析,完全没理清楚,从分析角度,需要哪些数据信息。例如电商业务系统会至少有订单信息、付款、物流数据,也有点击流日志数据、外部网站爬取数据、客服数据,然后还有企业方计划数据。 像这些看似独自的数据,包含了业务运营的相关的全过程,以及相关影响信息,所以数据模型就需要按照上述专题进行描述。因为这样的描述, 可以衍生新的维度、指标,将业务描述清晰,从而将静态的业务数据,在 BI 数据模型中,演变成可以多层次、多视角动态分析的立体模型。
另外说一个项目开发问题,正因为我的数据建模未太多依赖数据源表结构,BI 的导入也非常快,数据模型实现建好,拿到数据就可以顺利导入,数据分析也随即展开,BI 应用也逐步和用户讨论。
什么是 BI 建模,建模的本质是什么?
前几天和大项目团队一起和厂商聚餐,后来发了个厂商的小礼品,是一个便签本,本子面上是塑料的壳,上面是一个活动日历,中间如下面的数据,由一个框架在数字上面,可以活动左右移动,框架上面有周日到周六的英文简称,最左边是指针,指着上下 2 列数字,分别代表月份,上是 12 年,下是 11 年。例如 11 年 6 月, 指针就会覆盖到第三列,那么我们看到框里的数字,就是从第四列到 10 列,大家看这些数字,刚好是 6 月的日历。如果是 11 年 7 月,则从第二列到七列,框架下面的代表月份的数字写得很清楚了。
1 2 3 4 5 6 7
2 3 4 5 6 7 8 9 1011121314
9 10 1112131415161718192021
16171819202122232425262728
----宋停云与您分享----
----宋停云与您分享----
232425262728293031
3031
话说这么多了,上面的例子是非计算机领域的日常用到的模型,来处理本来需要 24 页纸来描述的日历,只要在一页纸上就能基本描述清楚。当然只是基本,唯一的缺点就是每个月都会有 31 日,这个模型无法处理掉,但是不影响我们的使用。
首先这个模型的目标是将 24 月日历的变化能在一个图表里完成,这也是这个设计的需求。那么设计者发现,其实日历的变化,无非是每月从 1 号开始的星期不一样,从周日到周六,都有可能,于是我们的能左右滑动的框(框里有周日到周六的对应指针),就能解决这个问题。那么这个数字就需要
您可能关注的文档
最近下载
- 风险管理与金融机构第二版课后习题答案+(修复的)()详细分析.doc VIP
- 白砂糖仓库管理方案范本.docx VIP
- 初中语文2024届中考成语专项练习(共20道选择题,附参考答案).doc VIP
- 最新版个人征信报告模板(word版-可编辑-带水印).docx VIP
- 部编版语文三年级下册第三单元3单元整体作业设计.docx VIP
- 新22J04-1 内装修一(墙面、吊顶)参考图集.docx VIP
- GB50278-2010 起重设备安装工程施工及验收规范.docx VIP
- 达索BIOVIA COSMOtherm 2020 用户指南.pdf
- 智慧养殖在线监测系统微型水质自动监测系统使用说明书.pdf
- 铜、铅、锌、银、镍、钼矿地质勘查规范.pdf VIP
文档评论(0)