数据仓库与数据挖掘的OLAP技术.pptVIP

  1. 1、本文档共73页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库与数据挖掘的OLAP技术

* * * * * * * 回答:由于较细粒度的数据不能由较粗粒度的数据产生,因此方体2不可用。其余皆行。 由于方体1中的粒度比查询所要求的粒度都细,所以,代价会最高。 如果不是有很多的year值与item相关联,而且每个brand值有许多item_name值,则方体3代价小 但如果方体4有有效的索引可用,则方体4可能更好。 * * * * * * * * * 由表和电子数据表到数据立方体 事实表包含事实事实的名称、度量和每个相关维表的关键字。如soles事实表可能包含time_key, item_key, …, dollars_sold, units_sold等 * 相对于sales立方体,all存储的是总销售额,而time存储的是某时间点针对所有商品、所有地方和所有厂商的总销售额… * * * * * * * * * * 数据仓库为商务分析提供了什么? * * 如何设计设计仓库?数据仓库的设计过程 * * 数据仓库的结构是什么样的?常常采用三层结构 底层是数据仓库服务器,它几乎总是一个关系数据库系统,它通过网间连接程序,由操作数据库和外部数据源提取数据。 中间层是OLAP服务器,它直接实现对多维数据的操作 顶层是客户,前端工具层,它包括查询和报告工具、分析工具和数据挖掘工具。 * * 第一,在一个合理短的时间(如1~2个月)内,定义一个高层的企业数据模型,在不同的主题和可能的应用之间,提供企业范围的、一致的、集成的数据视图。这个高层模型将大大减少今后的集成问题。 第二,基于上述相同的企业数据模型,可以并行地实现独立的数据集市和企业数据仓库 第三、可以构造分布式数据集市,通过网络中心服务器集成不同的数据集市 最后,构造一个多层数据仓库。企业仓库是所有仓库数据的唯一管理者,仓库数据分布在一些依赖的数据集市中。 * * * * * Arbor Essbase OLAP Server 5 Contact: Arbor Software * 408-744-9500 or 800-858-1666 Web: Price: $25,000 for Arbor Essbase Enterprise Server, $10,000 for Arbor Essbase Development Server, $85,000 for Arbor Essbase Financial Data Mart, $3500 per concurrent Essbase user, $995 per PC for Personal Essbase. A dozen tools and specialized modules cost extra. System Requirements: Windows NT, Windows 9x, OS/2, AS/400, HP-UX, IBM AIX, or Sun Solaris servers, Windows, Macintosh, or UNIX clients, Web browsers, or network computers * * * * 公式中的 +1 是因为在维外还有一个 all,即:几维的总和。 例如:对于一个2维(a,b)3层(a1,a2,a3; b1,b2,b3)的数据立方体:可能产生的方体总数为(3+1)*(3+1)=16。具体如下: aAll, a1, a2, a3分别与 bAll, b1, b2, b3相关联形成所有的方体: 1. (aAll, bAll) 2.(aAll, b1) 3. (aAll, b2) 4.(aAll, b3) 5. (a1, bAll) 6.(a1, b1) 7. (a1, b2) 8.(a1, b3) 9. (a2, bAll) 10.(a2, b1) 11. (a2, b2) 12.(a2, b3) 13. (a3, bAll) 14.(a3, b1) 15. (a3, b2) 16.(a3, b3) * * Indexing OLAP Data: Join Indices 连接索引:流行于关系数据库查询处理 连接索引登记来自两个关系数据库的可连接行 例:R (Rid, A) ?? S (Sid, B) ? JI (Rid, Sid) 连接索引记录识别可连接的元组 连接索引特别适合于数据仓库的星型模式 事实表和它对应维表的连接属性是事实表的外关键字和维表的主关键字 连接索引保持维的属性值和事实表的对应行之间的关系 连接索引可跨越多个维,从而可以识别感兴趣的子方 * Example:Join Indices 星型模式 sales_star[time, item, branch, location]:

您可能关注的文档

文档评论(0)

lifupingb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档