pentaho工具使用手册.docxVIP

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Pentaho工具 使用手册 作者:马腾,李洪宇 版本:1.0 目录 TOC \o 1-3 \h \z \u BI 介绍 2 Pentaho产品介绍 3 Pentaho产品线设计 4 Pentaho BI Platform安装 4 Pentaho Data IntegrationKettle 8 Pentaho Report Designer 12 Saiku 23 Schema Workbench 27 附件 32 BI 介绍 1. BI基础介绍 BI(BusinessIntelligence)即商务智能,它是一套完整的解决方案,利用数据仓库、数据挖掘技术对客户数据进行系统地储存和管理,并通过各种数据统计分析工具对客户数据进行分析,提供各种分析报告,为企业的各种经营活动提供决策信息。其中的关键点是数据管理,数据分析,支持决策。 根据要解决问题的不同,BI系统的产出一般包括以下三种: 2. BI系统的产出 2.1固定格式报表 固定格式报表是BI最基本的一种应用,其目的是展示当前业务系统的运行状态。固定格式报表一旦建立,用户就不可以更改报表的结构,只能依据数据库的数据不断刷新报表,以便取得较新的数据。在pentaho产品线中,我们使用pentaho report designer来实现固定格式报表的需求。 2.2OLAP分析 OLAP分析是指创建一种动态的报表展示结构,用户可以在一个IT预定义的数据集中自由选择自己感兴趣的特性和指标,运用钻取,行列转换等分析手段实现得到知识,或者验证假设的目的。在pentaho产品线中,我们使用Saiku来实现OLAP分析的需求。 2.3 数据挖掘 数据挖掘是BI的一种高级应用。数据挖掘是指从海量数据中通过数据挖掘技术得到有用的知识,并且以通俗易懂的方式表达知识,以便支持业务决策。在pentaho产品线中,我们使用weka来实现数据挖掘的需求。 Pentaho产品介绍 1. 产品介绍 Pentaho是世界上最流行的开源商业智能软件,以工作流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它是一个基于java平台的商业智能套件,之所以说是套件是因为它包括一个web server平台和多个工具软件:报表,分析,图表,数据集成,数据挖掘等,可以说包括了商业智能的方方面面。 2. Pentaho架构图 Pentaho的架构图如下,简要解释如下: 3rd party applications指交易系统,也就是数据仓库的原系统。 Data Application Integration主要指定义数据仓库的元数据,在数据仓库结构设计完毕后,通过ETL过程将原系统数据送入数据仓库。 Business Intelligence Platform指pentaho提供的BI平台,在这个平台上可以进行平台安全设置,平台管理之类的工作,这个平台也是BI服务的基础。 Reporting,Analysis,Dashboards,Process Management是基于BI平台上Pentaho可以实现的服务,比如报表,分析,仪表盘,服务自动控制等。 Presentation Layer指展示层,在这一层,我们可以把其下层做好的报表等分析结果通过门户网站,Email等各种方式展示给用户。 Pentaho产品线设计 1. 产品线设计 Pentaho作为一个开源的BI套件,商业版与社区版加起来共有几十种产品。考虑到恒信实际业务开展的情况,以及未来可能的需求,确定产品线如下。 BI Function Product ETL Kettle Metadata Management Pentaho Metadata Editor (PME) OLAP Saiku + Schema Workbench Report tools Fixed report:Pentaho report designer Ad-hoc report:Saiku Dashboard:CDE Data Mining Weka BI platform Pentaho BI Platform R language R Big Data Pentaho for Big Data 产品线的设计并非一成不变,随着需求的增加,当某些需求无法利用现有的产品线实现时,可以继续添加组件,以便形成更为完善的BI体系。 Pentaho BI Platform安装 1. 安装步骤 将下载下来的biserver-ce-X.X.X-stable.zip文件解压到D:\下,将会产生administration-console和biserver-ce两个文件夹,前者是pentah

文档评论(0)

beoes + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档