石油社《物流信息技术》教学课件-NO2.pptVIP

石油社《物流信息技术》教学课件-NO2.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 模块七 数 据 仓 库 (二)数据集市的数据来源 通常一个公司的数据集市可以通过两种途径来创建,第一种途径是直接从OLTP系统中将数据捕获到需要使用数据的数据集市中;第二种途径是先将OLTP系统中的数据捕获到中央数据库中,再将数据仓库中的数据填充到数据集市中。图2-14所示为从一个数据仓库中抽取的分别服务于市场部、财务部和销售部的数据集市。 模块七 数 据 仓 库 图2-14 数据集市 模块七 数 据 仓 库 星形模式 三、 模块七 数 据 仓 库 图2-15 星形模式 模块七 数 据 仓 库 事实表 1. 事实表由两部分组成,一部分是主码,用于连接各维数表。图2-15中销售事实表的主码为产品编号、客户编号、供应商编号、订单编号和时间编号。 事实表的另一部分是数据仓库的数值指标(也称为事实),该指标是用于分析的数值化信息。图2-15中销售事实表的指标有单价、数量和折扣。 指标的特征是数值化和可加性。但有时也会发现数据仓库中的某个指标可能不具备可加性,而指标的其他运算值(如平均值)却是有意义的,这称为半可加性指标(或事实)。 模块七 数 据 仓 库 维数表 2. 每个维数表都有一个主码,如图2-15中的产品维数表、客户维数表、供应商维数表、订单维数表和时间维数表的主码分别为产品编号、客户编号、供应商编号、订单编号、时间编号。除此之外,每个维数表还包括若干个其他的属性,这些属性具有丰富的性质。例如,产品维数表的“颜色”属性具有如下的性质:可用文字描述、离散的、可用于定义限制条件、可为分析过程提供行标题。 模块七 数 据 仓 库 数据挖掘 四、 模块七 数 据 仓 库 哪些因素对某类产品的销售额最有影响力?),决策分析员将不得不假设这些问题的答案,然后使用查询工具收集必要的信息,以验证或推翻自己的答案。显然,这样一个过程取决于决策分析人员的直觉,如果决策分析人员的直觉失误,就得不到正确的答案。而数据挖掘技术能够自动分析数据,进行归纳性推理,从中发掘出数据间的潜在模式、趋势和相关性。因此,数据挖掘技术是解决定性问题的可靠方法。 模块七 数 据 仓 库 (一)数据挖掘的概念 数据挖掘,顾名思义就是在超大型数据库(very large data bases,VLDB)或数据仓库中搜索有用的商业信息的过程,这与从矿山中挖掘矿石的过程是类似的,都需要对巨大数量的材料进行筛选或用智能去探查价值的真正所在。给定足够大小或定量的数据库,数据挖掘技术就可以使用一组算法浏览数据,自动地发现模型、趋势和相关性,帮助用户发现其他用户可能实现不了的、隐藏在内部的信息,从而帮助企业产生新的商业机会。数据挖掘技术具有以下性能: 模块七 数 据 仓 库 自动预测趋势和行为 1. 数据挖掘会自动在大型数据库中寻找预测性信息。在传统方法下需要进行大量分析的问题现在可以直接从数据挖掘中快速找到答案,数据挖掘技术的典型应用是目标市场营销。 模块七 数 据 仓 库 自动发现以前未知的模式 2. 数据挖掘工具可以识别以前隐藏的模式。模式发现的一个例子是通过分析零售数据来识别看似无关但经常放在一起购买的商品,如婴儿尿布和啤酒。其他模式发现问题包括对信用卡欺诈交易的检测和对由于数据输入错误而造成的异常数据的识别等。 对于数据挖掘还有以下几点说明: (1) 数据挖掘可以寻找相关数据,而在一个非常大的数据库中相关数据经常是很难定位的。 模块七 数 据 仓 库 (2) 一个公司的数据库可能是合并在数据仓库或数据集市中的,也可能是存放在数据库或Internet和Intranet服务器上的,数据挖掘工具可以挖掘出埋藏在公司文件或公共记录中的“矿石”。 (3) “采矿者”一般是最终用户,他们仅有有限的或完全没有编程能力。 (4) 数据挖掘可以得到意想不到的有价值的结果。 (5) 数据挖掘工具经常与电子表格软件和其他最终用户软件开发工具结合在一起。因此,被挖掘出的数据可以快速而容易地进行分析和处理。 (6) 数据挖掘

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档