实时挖掘企业信息数据.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 1 PAGE 1 实时挖掘企业信息数据 一.引言 今些年来,很多企业需要对信息系统数据进行深加工,以获得在何种经营、决策状况下的有效的结果和过程发展的趋势,以便于企业对现行发展进行决策。所以,以信息系统为基础的决策支持系统(DSS:DecisionSupportSystem)也正在从“不成熟期”向“成熟期”迈进。 在信息系统中有一概念就是数据的挖掘,从数据挖掘的概念上来讲,主要是历史的、有一段时间的、较为完整的数据进行分析、整理,得出企业的发展的规律以及在一定的历史条件下,采取什么样的措施得到其相应的结果,但是这样的概念好像和信息的实时性相违背。这样的想法,未免不让想到是否应当有“实时数据挖掘系统”。 对企业信息系统中数据的挖掘,我们自然联想到数据仓库。数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策。数据仓库在应用上符合DSS的需要,同时数据仓库也是DSS处理的基础。那么我们的实时挖掘信息系统的数据是否是从数据仓库中采集数据的呢? 既然是“仓库”必定和实时性相违背,信息数据需要深加工,现在唯一的解决方式方法就是进行数据仓库化处理,建立数据仓库的环境,进行数据快照,对数据进行抽取、集成和包装。实时信息系统是动态的系统,数据库也是动态数据存取,访问量大,变化快的东西不易做分析。我们挖掘企业信息系统什么信息,如何挖掘这些信息? 实时挖掘信息数据也是针对数据仓库的,仅仅在概念上数据仓库所囊括的数据性质有些变化,我们还是先从数据仓库入手,了解挖掘的原理再来分析挖掘实时信息数据。 二.非实时性数据仓库 在数据仓库中只有单一集成的数据资源,并且因为数据是可访问的,所以与传统数据环境相比,在数据仓库环境中DSS分析员的工作将要简单得多。 建筑数据仓库有两个主要方面—与操作型系统接口的设计和数据仓库本身的设计。在某种程度上来说,“设计”并不能精确描述在启发式方式下建筑数据仓库时发生了什么。首先,载入一部分数据,供DSS分析员使用和查看。然后,依据最终用户的反馈,在数据仓库中修改、增加一些数据。 这种反馈循环贯穿于整个数据仓库的开发过程。在设计数据仓库时,不能采用设计传统“需求驱动(CaseDrive)”系统同样的方法。在另一方面,那种认为不预估需求是好思路的想法也是错误的。在实际中,通常是介于两者之间的。 数据仓库的设计是面向主题域的,这个主题域的概念在性质上和对象全都,但是主题域是一个范围的概念,而对象是一个事物。目前面向对象的设计较为常见,好像面向主题域的设计很难理解,从我个人观点来看,恰恰相反,面向主题域的设计很简洁,但是若考虑主题域的数据“冒泡”,那么困难就来了。 作为非实时性数据仓库,就是现在人们常说的数据仓库(实时性数据仓库为性质上的区分),前人描述的已经太多了,在这里我描述的非实时性数据仓库的数据“冒泡”,什么是数据仓库的数据“冒泡”?数据冒泡就是多系统数据的整合时,比如中国电信的数据和中国联通的数据整合在一起来分析时,我们必定重新建立一套数据结构,那么从中国电信系统的数据如何导出到新建系统中?中国联通呢? 在数据仓库技术中,目前描述最多的是在同一数据库体系内数据整合,那么不同系统间同一类数据又如何整合? 当然,系统是依据用户的需求来完成的,是否有这样的一个机构有义务将该行业的不同系统内数据收集起来进行分析?我们在分析的时候,是否是将数据经过人工加工而得出分析数据,那么这样的数据有什么意义,那么下一次同样的数据如何来分析,还需要一次手工操作,这样不同系统的数据如何采用“冒泡”的形式,将数据冒到新建的分析系统中去。 设计含有主题域的数据仓库系统是简洁的,如何设计不同主题域数据并进行冒泡是否为以后数据仓库系统的发展的一个方向? 企业实施ERP等系统之后,大量的信息被采集到了,这些看上去特别有用处的信息如何被处理?数据必需被深加工,得出企业用于决策的信息,这些信息一般都是在企业执行一项操作后,依据数据查看一下收益结果,并把这个结果作为下一次决策时的数据参考,当然社会在短期内对个别企业的反应在大体上是全都的,这样,企业依据这样的数据就可以进行短期的较为精确的预估。 三.实时性数据仓库 作为目前实施的ERP系统是集成模块的,我原先实施系统时曾称之为“BeanSoftware”(积木软件),这类软件采用原始的数据库结构,假如采用实时的数据仓库,则不适应系统,为此在我们也谈谈什么样系统对数据实时性分析存在意义,而什么样的系统对实时性数据分析没有什么意义。 我在AMT上也曾写了一篇关于电力行业E

文档评论(0)

186****8296 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档