- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
kettle基本介绍
ETL工具之Kettle 讲师:王慧君目录Kettle基本介绍1.Kettle是什么?2.ETL3.Kettle历史4.Kettle学习资料5.Kettle特点6.和其它ETL工具对比7.安装和运行8. Kettle 的几个子程序9.资源库Kettle基本介绍Kettle基本介绍Kettle是一款国外开源的etl工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定KettleK:Kettle的缩写e:Environment(环境)e:Extract(数据的抽取)t:Transformation(数据的转换)t:Transportation(数据的传输)l:Loading(数据的加载)Kettle是什么Kettle基本介绍Kettle基本介绍ETL:ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、清洗(Cleaning)、加载(load)至目的端的过程。ETL一词较常用在数据仓库.Extract: 一般抽取过程需要连接到不同的数据源,以便为随后的步骤提供数据。Transform:任何对数据的处理过程都是转换。这些处理过程通常包括下面一些操作: 移动数据 根据规则验证数据 数据内容和数据结构的修改 将多个数据源的数据集成 根据处理后的数据计算派生值和聚集值等等加载(Load):将数据加载到目标系统的所有操作。ETL是什么Kettle基本介绍Kettle基本介绍2007年 Kettle 2.4, Kettle 2.5(被Pentaho 公司收购,更名为 PDI)2008年 Kettle 3.0 ,Kettle 3.12009年 Kettle 3.2 (一个使用时间较长的稳定版本)2010年 Kettle 4.0 ,Kettle 4.12011年 Kettle 4.22012年 Kettle 4.3 ,Kettle 4.4 (License 变更为 Apache 2,支持大数据)2013年 Kettle 5.02014年 Kettle 5.1、5.22016年4月 Kettle 6.0Kettle历史Kettle基本介绍Kettle基本介绍1./,/2.( 官方文档 )3.《Kettle Cook Book》4.《Pentaho 3.2 Data Integration Beginner’s Guide》5.《Kettle Solution》6.Kettle 源代码 源代码下载地址:svn:///svnkettleroot/Kettle/trunkBug报告地址:/browse/PDI/browse/PDI官方论坛:/forumdisplay.php?f=135/forumdisplay.php?f=135中文论坛:/Kettle学习资料Kettle基本介绍Kettle基本介绍商业ETL 工具软件Informatica/IBM DataStage/Microsoft SSIS/Oracle ODI开源ETL 工具软件Kettle/alend/CloverETLKetl/Octopus …Kettle :纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定Kettle 特点Kettle基本介绍Kettle基本介绍Kettle vs Informatica相似点:1.Pentaho 和 Informatica 都提供了大量的转换步骤、脚本功能, 都可以处理复杂的ETL 转换。2.通常情况下 Informatica 比 Kettle 更快。Informatica 有下推优化,缓存查询等 提高性能的手段。但是如果你对 Kettle 和数据库有足够的了解, 做一些调整,你可以提高 Kettle 的速度,在一些情况下可以达到 甚至超过 Informatica 的速度Kettle 的优点:Kettle 的易用性比 Informatica 好,需要的培训要少很多。Kettle 不需要像 Informatica 那样大的前期投入。Kettle 的插件架构支持快速定制开发Informatica 的优点:Informatica 的错误报告功能比 Kettle 更友好,更容易定位错误。Kettle 通常只把异常抛出,需要实施人员有更丰富的经验。Informatica 比 Kettle 有更好的监控工具和负载均衡等企业级应用功能,更适合大规模的ETL 应用。ETL对比Kettle基本介绍Kettle基本介绍 1. KETTLE要求先安装JDK1.5版本或以上 2.下载地址: http://sourceforge.jp/projects/sfnet_pentaho/relea
文档评论(0)