数据仓库第二版 - 08外部数据非结构化资料与资料仓库.pdfVIP

  • 10
  • 0
  • 约 8页
  • 2017-09-22 发布于湖南
  • 举报

数据仓库第二版 - 08外部数据非结构化资料与资料仓库.pdf

下载 第8章 外部数据/非结构化数据与数据仓库 大部分组织是以现有系统为来源的数据(即企业的内部数据)上建立其第一个数据仓库。 在绝大部分情况下,从现有系统抽取的数据可称为内部结构化数据。数据来自于企业内部, 并且数据已经被变换成一种规则的格式。 但是,企业合法使用的其他大量数据却并非产生于企业本身的系统。这类数据称作外部 数据,通常这些数据是以非结构化的、不可预测的格式进入企业的。图8- 1表示了进入数据仓 库的外部与非结构化数据。 外部数据 非结构化数据 现有系统 数据仓库 图8-1 外部数据与非结构化数据都归入数据仓库 数据仓库是存储外部与非结构化数据的理想场所。如果外部数据与非结构化数据没有存 放在一个集中确定的位置,势必会产生一些问题。图8- 2表明当外部数据与非结构化数据以非 规范的形式进入企业时,就失去了数据来源的标识,并且不管怎样有次序地使用数据都不存 在数据间的协同。 典型地,当外部数据没有进入数据仓库时,这些数据就通过 P C进入企业。在P C级上,本 质上进入的数据不存在任何错误。但是当数据在 P C级上进入时,几乎都是通过电子表格方式

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档