自研分布式海量小文件存储系统的设计与实现.docxVIP

  • 55
  • 0
  • 约2.89千字
  • 约 15页
  • 2022-03-16 发布于浙江
  • 举报

自研分布式海量小文件存储系统的设计与实现.docx

? ? 360自研分布式海量小文件存储系统的设计与实现 ? ? 背景 近年来,公司业务发展迅猛,为数众多的业务场景产生了大量的图片,文档,音频,视频等非结构化数据,尤其是随着移动互联网、AI、IoT技术的成熟和应用市场的全面爆发,大量智能硬件设备将会生成更大规模的非结构化多媒体数据。如此大量的小文件如何存储,问题应运而生。传统存储厂商出售的存储服务价格昂贵,公有云厂商对具体业务场景的定制化改造略有欠缺,因此,我们决定自研小文件存储服务。 NebulasFs简介 曾经关注小文件存储技术的同学可能阅读过Facebook发表的那篇关于海量小图片存储系统Haystack的论文(Finding a needle in Haystack: Facebook’s photo storage),Haystack通过合并多个小文件成一个大文件、以减少文件数量的方式解决了普通文件系统在存储数量巨大的小文件时的问题:获取一次文件多次读取元数据信息、文件访问的“长尾”效应导致大量文件元数据不容易缓存等。基于在Haystack的论文中得到的借鉴和参考,我们研发了自己的分布式小文件存储系统——NebulasFs。它是一个分布式、高可用、高可靠、持久化小文件存储系统,可以存储数以百亿的小文件。 架构设计 从分布式角色上划分,可以分为Master和Datanode两个大的角色。 其中,Master负责集群

文档评论(0)

1亿VIP精品文档

相关文档