大数据平台构建(国家) 大数据平台构建(国家) 05 操作笔记 Apache Pig 安装.docxVIP

大数据平台构建(国家) 大数据平台构建(国家) 05 操作笔记 Apache Pig 安装.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Apache Pig 安装 本章将介绍如何在系统中下载,安装和设置?Apache Pig?。 先决条件 在你运行Apache Pig之前,必须在系统上安装好Hadoop和Java。因此,在安装Apache Pig之前,请按照前面的课程内容搭建好Hadoop 下载Apache Pig 首先,从以下网站下载最新版本的Apache Pig: / 步骤1 打开Apache Pig网站的主页。在News部分下,点击链接release page,如下面的快照所示。 步骤2 点击指定的链接后,你将被重定向到?Apache Pig Releases?页面。在此页面的Download部分下,单击链接,然后你将被重定向到具有一组镜像的页面。 步骤3 选择并单击这些镜像中的任一个,如下所示。 步骤4 这些镜像将带您进入?Pig Releases?页面。?此页面包含Apache Pig的各种版本。?单击其中的最新版本。 步骤5 在这些文件夹中,有发行版中的Apache Pig的源文件和二进制文件。下载Apache Pig 0.16,?pig0.16.0-src.tar.gz?和?pig-0.16.0.tar.gz?的源和二进制文件的tar文件。 安装Apache Pig 下载Apache Pig软件后,按照以下步骤将其安装在Linux环境中。 步骤1 在安装了?Hadoop,Java和其他软件的安装目录的同一目录中创建一个名为Pig的目录。(在我们的教程中,我们在名为Hadoop的用户中创建了Pig目录)。 $ mkdir Pig 第2步 提取下载的tar文件,如下所示。 $ cd Downloads/ $ tar zxvf pig-0.15.0-src.tar.gz $ tar zxvf pig-0.15.0.tar.gz 步骤3 将?pig-0.16.0-src.tar.gz?文件的内容移动到之前创建的?Pig?目录,如下所示。 $ mv pig-0.16.0-src.tar.gz/* /home/Hadoop/Pig/ 配置Apache Pig 安装Apache Pig后,我们必须配置它。要配置,我们需要编辑两个文件 -?bashrc和perties?。 .bashrc文件 在?.bashrc?文件中,设置以下变量 PIG_HOME?文件夹复制到Apache Pig的安装文件夹 PATH?环境变量复制到bin文件夹 PIG_CLASSPATH?环境变量复制到安装Hadoop的etc(配置)文件夹(包含core-site.xml,hdfs-site.xml和mapred-site.xml文件的目录)。 export PIG_HOME = /home/Hadoop/Pig export PATH = PATH:/home/Hadoop/pig/bin export PIG_CLASSPATH = $HADOOP_HOME/conf perties文件 在Pig的?conf?文件夹中,我们有一个名为?perties?的文件。在perties文件中,可以设置如下所示的各种参数。 pig -h properties 支持以下属性: Logging: verbose = true|false; default is false. This property is the same as -v switch brief=true|false; default is false. This property is the same as -b switch debug=OFF|ERROR|WARN|INFO|DEBUG; default is INFO. This property is the same as -d switch aggregate.warning = true|false; default is true. If true, prints count of warnings of each type rather than logging each warning. Performance tuning: pig.cachedbag.memusage=mem fraction; default is 0.2 (20% of all memory). Note that this memory is shared across all large bags used by the application. pig.skewedjoin.reduce.memusagea=mem fracti

您可能关注的文档

文档评论(0)

WanDocx + 关注
实名认证
文档贡献者

大部分文档都有全套资料,如需打包优惠下载,请留言联系。 所有资料均来源于互联网公开下载资源,如有侵权,请联系管理员及时删除。

1亿VIP精品文档

相关文档