数据挖掘软件和ODS.docVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
五个免费开源的数据挖掘软件什么是ODS?信息处理的多层次要求导致了一种新的数据环境——DB-DW的中间层ODS(操作型数据存储)的出现。ODS是“面向主题的、集成的、当前或接近当前的、不断变化的”数据。通过统一规划,规范框架和数据,ODS可以实现操作型数据整合和各个系统之间的数据交换,能够提供实时的操作型报表,减轻数据仓库的负担。建设ODS还可以为后期数据仓库建设做好准备。 什么是ODS? ODS全称为Operational Data Store,即操作型数据存储,是“面向主题的、集成的、可变的、反映当前数据值的和详细的数据的集合,用来满足企业综合的、集成的以及操作型的处理需求”(Bill.Inmon)。ODS是数据仓库体系结构中的一个可选部分,ODS具备数据仓库的部分特征和OLTP系统的部分特征。 1.1 ODS的出现 系统应用集成中一般对各系统中数据分为两类:操作型数据,有细节化,分散化的特点;决策型数据,有综合化,集成化的特点。 ? ?? ? 数据仓库概念的提出也把数据处理划分为了操作型处理和分析型处理两种不同类型,从而建立起了DB-DW的两层体系结构。但是有很多情况,DB-DW的两层体系结构并不能涵盖企业所有的数据处理要求,比如有些实时性决策问题,它要求获取数据周期不能太长,而且也需要一定程度的汇总。信息处理的多层次要求导致了一种新的数据环境——DB-DW的中间层ODS(操作型数据存储)的出现。它像DW一样是一种面向主题,集成的数据环境,又像操作型DB一样包含着全局一致的、细节的当前的数据。这样就构成了DB-ODS-DW的关于企业数据的三层体系结构。 1.2与应用系统、数据仓库的比较 ? ?? ? 根据数据仓库之父Bill. Inmon的定义,“数据仓库是面向主题的、集成的、稳定的、随时间变化的,主要用于决策支持的数据库系统”。下面对数据仓库、ODS和数据库进行多方面的比较: 比较项目 数据仓库 ODS 应用系统 建设目的 决策支持 实时监控 业务操作 服务对象 企业管理层 业务管理层 生产层 存储周期 长期 短期 即时 处理频率 非实时 准实时 实时 主要功能 分析功能 事务处理,短时分析 事务处理 技术实现 OLAP OLAP、OLTP OLTP 功能结构 集中 相对集中 分散 数据类型 明细数据,汇总数据 明细数据 明细数据 数据容量 非常大 小 小 1.3 应用集成方案比较 实施方案 实施结果 优势 缺陷 数据仓库(DW) 企业能够分析DW中的历史数据,进行中远期的规划 可以解决企业的决策需求 不能满足企业的实时监控和实时业务需求 操作型数据存储(ODS) 企业能够把握ODS中的当前综合数据,对企业的及时运行情况随时掌控 可以满足企业的实时监控和实时业务需求 不能满足企业的中远期决策需求 DW+ODS 企业能够分析ODS中的当前综合数据,对企业当前运行情况进行宏观控制;能够分析DW中的历史数据,对未来进行合理规划 ODS技术的引入和应用,为企业在日常经营中进行即时OLAP提供了一种解决方案,使得企业无须建立一个“臃肿”的DW,就可以进行一些非战略性的中层决策,来实现对企业的日常管理和控制,同时也能获得较快的响应速度。Orange ? ? Orange是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++和Python开发,它的图形库是由跨平台的Qt框架开发。 ? ? RapidMiner ? ? RapidMiner,以前叫YALE(Yet Another Learning Environment),其是一个给机器学习和数据挖掘和分析的试验环境,同时用于研究了真实世界数据挖掘。 ? ? 它提供的实验由大量的算子组成,而这些算子由详细的XML文件记录,并被RapidMiner图形化的用户接口表现出来。RapidMiner为主要的机器学习过程提供了超过500算子,并且,其结合了学习方案和Weka学习环境的属性评估器。它是一个独立的工具可以用来做数据分析,同样也是一个数据挖掘引擎可以用来集成到你的产品中。 ? ? Weka ? ? 由Java开发的Weka(Waikato Environment for Knowledge Analysis)是一个知名机器学机软件,其支持几种经典的数据挖掘任务,显著的数据预处理,集群,分类,回归,虚拟化,以及

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档