Hadoop序列化中的工厂设计模式.docxVIP

  • 5
  • 0
  • 约7.78千字
  • 约 9页
  • 2017-01-22 发布于重庆
  • 举报
Hadoop序列化中的工厂设计模式

Hadoop 序列化中的工厂设计模式最近学习《Hadoop技术内幕》,简单研究了部分Hadoop源码。综合以前了解的一些开源项目,发现高端代码乍一看上去有一个共同特性:到处都是泛型,到处都是反射。直接打开一个方法的定义,基本找不到它的实现逻辑,只能找到接口。后来结合书上的介绍稍作了解,出现这种现象,说明源码很多都用到了抽象工厂模式。故再次查阅了抽象工厂的定义。相信这对于今后开发中定义一个优秀的架构是很有帮助的。抛出问题:Hadoop的序列化在Hadoop中有序列化的概念。简单搞清楚序列化:序列化是什么?就是把对象转化成二进制的流。反序列化就是把二进制流转化成对象。为什么要序列化?三点:持久化格式用于存储;通信数据格式用于传输;对象深拷贝;Hadoop中主要用前两点。为什么不用Java内建的序列化?Java序列化非常强大。序列化的时候把什么类描述,各种版本号,父类的信息都写到流中。一个简单的类能写出一大推数据来,对于强烈需要减少传输量提高效率的分布式计算就不适应。故Hadoop自己搞了一套。搞清楚了序列化的概念,然后再说一下有哪些东西需要序列化:Java中不是有个Serializable接口吗?同样:在hadoop中有Writable接口,实现Writable的类都是要序列化的类。简单举例几个:IntWritable,LongWritable,Text。在java中就是int,Lon

文档评论(0)

1亿VIP精品文档

相关文档