- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Apache Pig 安装
本章将介绍如何在系统中下载,安装和设置?Apache Pig?。
先决条件
在你运行Apache Pig之前,必须在系统上安装好Hadoop和Java。因此,在安装Apache Pig之前,请按照前面的课程内容搭建好Hadoop
下载Apache Pig
首先,从以下网站下载最新版本的Apache Pig: /
步骤1
打开Apache Pig网站的主页。在News部分下,点击链接release page,如下面的快照所示。
步骤2
点击指定的链接后,你将被重定向到?Apache Pig Releases?页面。在此页面的Download部分下,单击链接,然后你将被重定向到具有一组镜像的页面。
步骤3
选择并单击这些镜像中的任一个,如下所示。
步骤4
这些镜像将带您进入?Pig Releases?页面。?此页面包含Apache Pig的各种版本。?单击其中的最新版本。
步骤5
在这些文件夹中,有发行版中的Apache Pig的源文件和二进制文件。下载Apache Pig 0.16,?pig0.16.0-src.tar.gz?和?pig-0.16.0.tar.gz?的源和二进制文件的tar文件。
安装Apache Pig
下载Apache Pig软件后,按照以下步骤将其安装在Linux环境中。
步骤1
在安装了?Hadoop,Java和其他软件的安装目录的同一目录中创建一个名为Pig的目录。(在我们的教程中,我们在名为Hadoop的用户中创建了Pig目录)。
$ mkdir Pig
第2步
提取下载的tar文件,如下所示。
$ cd Downloads/ $ tar zxvf pig-0.15.0-src.tar.gz $ tar zxvf pig-0.15.0.tar.gz
步骤3
将?pig-0.16.0-src.tar.gz?文件的内容移动到之前创建的?Pig?目录,如下所示。
$ mv pig-0.16.0-src.tar.gz/* /home/Hadoop/Pig/
配置Apache Pig
安装Apache Pig后,我们必须配置它。要配置,我们需要编辑两个文件 -?bashrc和perties?。
.bashrc文件
在?.bashrc?文件中,设置以下变量
PIG_HOME?文件夹复制到Apache Pig的安装文件夹
PATH?环境变量复制到bin文件夹
PIG_CLASSPATH?环境变量复制到安装Hadoop的etc(配置)文件夹(包含core-site.xml,hdfs-site.xml和mapred-site.xml文件的目录)。
export PIG_HOME = /home/Hadoop/Pig export PATH = PATH:/home/Hadoop/pig/bin export PIG_CLASSPATH = $HADOOP_HOME/conf
perties文件
在Pig的?conf?文件夹中,我们有一个名为?perties?的文件。在perties文件中,可以设置如下所示的各种参数。
pig -h properties
支持以下属性:
Logging: verbose = true|false; default is false. This property is the same as -v switch brief=true|false; default is false. This property is the same as -b switch debug=OFF|ERROR|WARN|INFO|DEBUG; default is INFO. This property is the same as -d switch aggregate.warning = true|false; default is true. If true, prints count of warnings of each type rather than logging each warning. Performance tuning: pig.cachedbag.memusage=mem fraction; default is 0.2 (20% of all memory). Note that this memory is shared across all large bags used by the application. pig.skewedjoin.reduce.memusagea=mem fracti
您可能关注的文档
- 车间安全与车身维修常用工具使用 车间安全与车身维修常用工具使用 8.实训指导(外径千分尺的工作原理).doc
- 车间安全与车身维修常用工具使用 车间安全与车身维修常用工具使用 8.实训指导(外径千分尺的介绍).doc
- 成本会计 项目三 分配与归集要素费用 项目三 分配与归集要素费用.doc
- 城市轨道交通车辆电气检修(刘浩) 任务五:掌握电机拆卸与安装 电机拆卸与安装.docx
- 城市轨道交通车辆机械检修(彭育强) 任务一:供风系统故障与处理 8.15储风缸检查.docx
- 城市轨道交通客运组织(谢淑润) 任务一:认知车站主体构成 1.1.1认知车站主体构成.docx
- 城市轨道交通客运组织(谢淑润) 任务一:站台直接换乘客流组织 上下层站台换乘车站大客流组织方案.docx
- 城市轨道交通联锁系统运行与维护(刘继光) 任务三 接口系统 计算机联锁系统之ZC故障.docx
- 城市轨道交通运营安全(马娜) 任务一:识别 人员影响因素 上海地铁十号线一工人掉入搅拌池事故.docx
- 城市轨道交通专用通信设备维护(曹源) 任务一:LTE技术介绍 LTE案例02.docx
- 2026《基于ABAQUS软件的隧道开挖过程模拟研究》2700字.docx
- 2026《某高校1号办公楼的板的设计案例》1100字.docx
- 2026《C水电站引水枢纽设计》17000字.docx
- 2026《基于超高效液相色谱-串联质谱法(UPLC-MS)的乙烯利残留检测研究》10000字.docx
- 2026《X街道安全生产监管能力问题及对策研究》开题报告7900字.docx
- 2026《关于3-6岁偏远地区隔代教育的研究结果分析案例》3300字.doc
- 2026《我国物流枢纽与海关多式联运监管概况概述》4100字.docx
- 2026《电力系统电压稳定与频率稳定协调控制研究》18000字.doc
- 2026《基于COMSOL的微波加热系统建模分析案例》1000字.docx
- 2026《煤矿员工不安全行为及影响因素研究》开题报告7700字.docx
原创力文档


文档评论(0)