Hadoop序列化中的工厂设计模式.docxVIP

下载本文档

5
0
约7.78千字
约 9页
2017-01-22 发布于重庆
举报

Hadoop序列化中的工厂设计模式.docx

Hadoop序列化中的工厂设计模式

Hadoop 序列化中的工厂设计模式最近学习《Hadoop技术内幕》，简单研究了部分Hadoop源码。综合以前了解的一些开源项目，发现高端代码乍一看上去有一个共同特性：到处都是泛型，到处都是反射。直接打开一个方法的定义，基本找不到它的实现逻辑，只能找到接口。后来结合书上的介绍稍作了解，出现这种现象，说明源码很多都用到了抽象工厂模式。故再次查阅了抽象工厂的定义。相信这对于今后开发中定义一个优秀的架构是很有帮助的。抛出问题：Hadoop的序列化在Hadoop中有序列化的概念。简单搞清楚序列化：序列化是什么？就是把对象转化成二进制的流。反序列化就是把二进制流转化成对象。为什么要序列化？三点：持久化格式用于存储；通信数据格式用于传输；对象深拷贝；Hadoop中主要用前两点。为什么不用Java内建的序列化？Java序列化非常强大。序列化的时候把什么类描述，各种版本号，父类的信息都写到流中。一个简单的类能写出一大推数据来，对于强烈需要减少传输量提高效率的分布式计算就不适应。故Hadoop自己搞了一套。搞清楚了序列化的概念，然后再说一下有哪些东西需要序列化：Java中不是有个Serializable接口吗？同样：在hadoop中有Writable接口，实现Writable的类都是要序列化的类。简单举例几个：IntWritable，LongWritable，Text。在java中就是int，Lon

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

Hadoop序列化中的工厂设计模式.docxVIP