数据仓库中的维度与粒度.pptVIP

下载本文档

578
0
约1.86千字
约 25页
2017-10-04 发布于浙江
举报

数据仓库中的维度与粒度.ppt

数据仓库中的维度与粒度

4.1 粗略估算计算数据仓库占用空间的方法：第一步：确定数据仓库中将要创建的所有表第二步：估计一年内可能的最少行数与最多行数第三步：估计五年内可能的最少行数与最多行数第四步：估计索引数据占用的空间第五步：计算空间一年总的最大空间=最大行大小*一年内最大行数一年总的最小空间=最小行大小*一年内最小行数另外，考虑备份和恢复所需要的空间估算结果的准确程度只需要达到数量级 4.3 溢出存储器应该考虑五年后如下因素：有更多的技术管理大量数据硬件费用下降功能更强大的软件工具最终用户更加专业化 4.3 溢出存储器历史数据与细节数据造成了数据的显著增长根据数据使用频率，可将数据分为二类：经常使用的数据不经常使用的数据（睡眠数据）解决方案：睡眠数据转移至海量备用存储器或近线存储器常用的溢出存储器可分为：低性能的磁盘存储器近线存储器串行磁带 …… 4.4 确定粒度级别一方面，合理推测粒度级别确定粒度还需要通过一定量的反复分析，根据用户反馈不断改进另一方面，预测不同体系结构的需求数据仓库中的数据需要处于最低的公共细节水平 4.5 反馈技巧提高数据粒度的方法：数据进入数据仓库时，进行汇总数据进入数据仓库时，求平均值数据集的最大/最小值放入数据仓库只放入显然需要的数据用条件逻辑选择需要的数据系统需求了解到50%左右时即可以开始建造数据仓

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

数据仓库中的维度与粒度.pptVIP