商业智能知识点.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
商业智能知识点.doc

数据仓库的数据组织结构 在数据仓库中,数据被分成4种级别,分别是高度综合级、轻度综合级、当前细节级、早期细节级。 当前的数据总是首先进入当前细节级,然后根据应用的需求,通过预运算将细节数据聚合成轻度综合和高度综合级数据。 随着时间的推移,系统中的一些细节数据已经老化了,很少会被用户使用,此时为了节省系统的存储空间,可以将这些老化的细节数据导出到备份设备上,这就是早期细节级数据。 由于客户呼叫数据的数据量很大,并且数据仓库的使用者常常只关心近期的细节数据,因此我们可以在系统中只保存近期的细节数据,而将之前的详细数据导出到备份设备中。 对于高度综合的数据,由于其数据量已经很少,所以一般可以不考虑它们的导出问题。 总的来说,数据仓库的这种组织方式的核心思想是:在系统中保留最有可能被用户使用的数据,而用户很少使用的数据则备份出系统。 综合程度不同的数据其用途不同,在数据仓库中多重的数据粒度是必不可少的。 但是,由于数据仓库最主要的目的是反映企业的整体信息和DSS分析,回答综合程度较高的问题。 如果为了回答许多细节问题,而使系统的数据量极度膨胀,从而降低系统的运营效率,就背离了系统建设的初衷,这也是我们在数据仓库数据组织方式中说明的,对细节数据和综合数据采用不同策略的原因。 实际的工程项目中,我们可以将综合数据较高的数据存放在访问速率较高的磁盘上,而将细节数据定期导出到低速的磁带上。 从数据仓库中导出的数据仍然属于数据仓库,只是在存储介质上发生了改变。 如果这两个样本的数据特征不类似,则继续抽样。 等到抽样获得的样本5、样本6它们的数值特征非常地相似,则认为样本集合的数值特征类似,并且都同源数据具有类似的特征 数据分割能提高数据处理的效率。 如果数据库中的数据没有发生变化,则不需要对数据仓库进行追加。 数据追加只增加在上次数据输入后数据库中变化了的数据。 要完成数据追加的工作,最关键的是“捕捉”数据变化,并将数据的变化记录下来。 并不是日志文件中所有的信息都是必须的,通过分析日志文件可以减少工作量。 数据仓库的清理与普通系统中清理的含义有区别。 在普通的系统中,数据清理意味着将数据删除。 数据仓库系统中的清理并不是简单地删除,而是从细化级别的数据逐渐上升为高级综合度的数据,直到数据已经不再具备任何意义时被清除的过程。 投资回报率不但同回报金额有关,还同回报的时间有关。 投资回报率和投资回报周期是对投资回报的定量分析。 投资回报分析通过ROI(Return of Investment,投资回报率)和投资回报周期来衡量。 如果企业决定建立数据仓库,则需要进行技术选择分析。 瀑布式开发方法的优点是:如果需求确定,进行认真的系统分析和设计后,开发可以采用流水线的方式,效率很高。 在传统的操作型应用中,瀑布模型得到了广泛的应用。 因为操作型应用的需求常常是事先确定的,因此采用瀑布模型可以得到很好的效果。 瀑布模型取得良好效果的前提是需求确定。 在分析型应用中,情况同操作型应用大不相同: (1) 在最终用户还不了解DSS系统的基本概念或者对DSS系统还没有比较敏感的认识时,用户很难提出良好的需求。 (2) 在最终用户对DSS系统有了一定的了解后,用户可能会提出非常庞大的问题;同时市场的需求以及决策者个人风格等诸多因素也是不断变化的,因此在DSS系统初步建立后,还需要不断地对其完善。 在为系统的初期阶段选择主题时,可以参考如下的几条原则: (1)优先实施管理者目前最迫切需求、最关心的主题。 (2)优先选择能够在较短时间内发生效益的决策主题。 (3)推后实施业务逻辑准备不充分的主题。 (4)推后考虑实现技术难度大、可实现性较低、投资风险大的主题。 螺旋式开发通过不断扩大开发范围的方式来逐渐完善数据仓库系统,这种方式可以使项目的方方面面均从中受益。 (1) 由于任务进行了阶段划分,企业能在比较短的时间内获得他们需要的一部分系统功能。 这些功能虽然还不非常完善,但是企业已经可以利用这些功能进行决策支持并从中受益。 螺旋式开发的思想是:越早让企业拥有决策支持系统(哪怕只是其中的一部分),企业就能越快从该系统受益。 (2) 开发团体则以与企业建立信任关系的方式从中收益 由于每个阶段的任务相对较小,需要的开发时间较短,阶段成果能够在比较短的时间内获得。 随着交付使用的成功系统的数目不断增多,企业对开发团队的专业技能有更充分的肯定,企业投资者对项目和团

文档评论(0)

docinppt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档