- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
java压缩和解压缩Zip、Jar、Gzip文件
对于那些大型的、没有边界的文件,如日志文件,有以下选项。
存储未压缩的文件。
使用支持分割机制的压缩格式,如bzip2。
在应用中将文件分割成几个大的数据块,然后使用任何一种支持的压缩格式单独压缩每个数据块(可不用考虑压缩格式是否支持分割)。在这里,需要选择数据块的大小使压缩后的数据块在大小上相当于HDFS的块。
使用支持压缩和分割的Sequence File(序列文件)。
对于大型文件,不要对整个文件使用不支持分割的压缩格式,因为这样会损失本地性优势,从而使降低MapReduce应用的性能。
第一, 有些压缩格式不能被分块,并行的处理,比如gzip
第二, 第二,另外的一些压缩格式虽然支持分块处理,但是解压的过程非常的缓慢,使job的瓶颈转移到了cpu上,例如bzip2。
第三, 如果能够拥有一种压缩算法,即能够被分块,并行的处理,速度也非常的快,那就非常的理想。这种方式就是lzo。
hadoop使用LZO压缩
博客分类:?
? hadoop
HadoopJavaApacheOpenSourceXML
1。安装LZO?sudo apt-get install liblzo2-dev?或者下载lzo2?/opensource/lzo/download/.?./configure --enable-shared?make?make install?确认安装成功?
Java代码??
1. %?ls?-l?/usr/lib*/liblzo2*??
2. -rw-r--r--??1?root?root?171056?Mar?20??2006?/usr/lib/liblzo2.a??
3. lrwxrwxrwx??1?root?root?????16?Feb?17??2007?/usr/lib/liblzo2.so?-?liblzo2.so.2.0.0*??
4. lrwxrwxrwx??1?root?root?????16?Feb?17??2007?/usr/lib/liblzo2.so.2?-?liblzo2.so.2.0.0*??
5. -rwxr-xr-x??1?root?root?129067?Mar?20??2006?/usr/lib/liblzo2.so.2.0.0*??
6. -rw-r--r--??1?root?root?208494?Mar?20??2006?/usr/lib64/liblzo2.a??
7. lrwxrwxrwx??1?root?root?????16?Feb?17??2007?/usr/lib64/liblzo2.so?-?liblzo2.so.2.0.0*??
8. lrwxrwxrwx??1?root?root?????16?Feb?17??2007?/usr/lib64/liblzo2.so.2?-?liblzo2.so.2.0.0*??
9. -rwxr-xr-x??1?root?root?126572?Mar?20??2006?/usr/lib64/liblzo2.so.2.0.0*??
2。下载hadoop-gpl-compression源码?
Java代码??
1. /a//p/hadoop-gpl-compression/downloads/list??
3.编译?
Java代码??
1. export?JAVA_HOME=/path/to/64bit/jdk??
2. export?CFLAGS=-m64??
3. export?CXXFLAGS=-m64??
4. ant?compile-native?tar??
4.拷贝生成的jar到指定目录?
Java代码??
1. cp?build/hadoop-gpl-compression-0.1.0-dev/hadoop-gpl-compression-0.1.0-dev.jar?/path/to/hadoop/dist/lib??
5.拷贝native library?
Java代码??
1. tar?-cBf?-?-C?build/hadoop-gpl-compression-0.1.0-dev/lib/native?.?|?tar?-xBvf?-?-C?/path/to/hadoop/dist/lib/native??
6.修改hadoop配置文件core-site.xml?
Xml代码??
1. property??
2. ????namepression.codecs/name??
3. ????valuepress.GzipCodec,press.DefaultCodec,pression.lzo.LzoCodec,press.BZip2Codec/valu
您可能关注的文档
最近下载
- 施工企业现场质量管理制度及奖惩办法.pdf VIP
- 传感器原理及应用 教案.pdf VIP
- 砂石料供应、运输、售后服务方案14627.pdf VIP
- 传承雷锋精神争做时代新人--主题班会课件.pptx VIP
- 气管切开非机械通气患者气道管理考试题及答案.doc
- 横河flxa21两线制电导率变送器快速启动手册.pdf VIP
- 图集规范-天津图集-12J5-1图集(2012版)平屋面 DBJT29-18-2013.pdf VIP
- 第2课+丰富多彩的中华传统体育+课件 2025-2026学年人教版(2024)初中体育与健康八年级全一册.pptx VIP
- 第12课 闭环控制助稳定 教案 义务教育人教版信息科技六年级全一册.pdf VIP
- 生命教育PPT模板.pptx VIP
文档评论(0)