- 4
- 0
- 约 6页
- 2016-01-08 发布于安徽
- 举报
Hadoop分布式文件系统:结构与设计1. 介绍
Hadoop 分布式文件系统 (HDFS)是一个设计为用在普通硬件设备上的分布式文件系统。它与现有的分布式文件系统有很多近似的地方,但又和这些文件系统有很明显的不同。HDFS 是高容错的,设计为部署在廉价硬件上的。HDFS对应用程序的数据提供高吞吐量,而且适用于那些大数据集应用程序。HDFS开放了一些POSIX的必须接口,容许流式访问文件系统的数据。HDFS最初是为了Apache 的Nutch网络搜索引擎项目的下层构件而设计的。是Hadoop项目的一部分,而这又是Apache的 Lucene项目的一部分。本项目的地址是: /projects/hadoop.html。
2. 假设与目标
2.1. 硬件错误
硬件错误是正常的,而不是异常。HDFS实例由成百上千个服务器组成,每个都存储着文件系统的一部分数据。事实上,这就会有大量的组件,而 每个组件出故障的可能性都很大,这意味着HDFS总有一些组件是不能工作的。因此,检测错误并快速自动恢复就成了HDFS的核心设计目标。
2.2. 流式数据访问
运行在HDFS上的应用程序需要流式的访问它们的数据集,它们也不是通常运行在普通文件系统上的普通应用程序。HDFS为了那些批量处理而 设计的,而不是为普通用户的交互使用。强调的是数据访问的高吞吐量而不是数据访问的低反应时间。PO
您可能关注的文档
- 人防竣工验收汇报材料1.doc
- 西方课堂行为管理理论.doc
- 总厂主要物料理化性.doc
- 社会化电子商务的三种形态.doc
- 吃什么清理血液垃圾.doc
- 单神经内科临床路径.doc
- 股骨头坏死全面介绍.doc
- 能源存储超级多孔碳研究报告.doc
- 网上下载软件教学设计.doc
- 微机原理与接口技术上机报告.doc
- 新疆塔城地区第一高级中学2025-2026学年高一下学期学情自测物理试卷(含解析).docx
- 苏教版五年级上册数学 期中检测卷.doc
- 新疆维吾尔自治区昌吉回族自治州呼图壁县2025-2026学年九年级上学期1月期末英语试题(含解析).docx
- 新疆维吾尔自治区和田地区和田市2025-2026学年上学期八年级英语期末试卷(含解析).docx
- 四川省绵阳市游仙区2025-2026学年七年级上学期1月期末英语试题(含解析).docx
- 苏教版三年级上册数学 第三单元测试题.doc
- 四川省绵阳市梓潼县2025-2026学年八年级上学期1月期末物理试题(含解析).docx
- 四川省绵阳市盐亭县四校联考2025-2026学年八年级下学期物理学情自测(含解析).docx
- 房颤患者太极拳练习.pptx
- 苏教版五年级上册数学 期末检测卷.doc
最近下载
- 2025年供应链管理师职业能力等级认证考试(助理级)历年参考题库含答案详解.docx VIP
- 0-【精编资料】-126-危险作业安全管理制度.docx VIP
- 打屁股作文共九篇.doc VIP
- milwaukee美沃奇 M18BIW12-402C 使用说明书 米沃奇.pdf VIP
- 毕业设计(论文)-基于PLC的仓库自动门禁与系统设计.doc VIP
- 抖音老账号冷启动(新版).docx VIP
- 2025年胃管堵塞处理课件.pptx
- 2025年供应链管理师职业能力等级认证考试(助理级)历年参考题库含答案详解(5套题).pdf VIP
- 烘焙米发酵酒理化性质分析.pdf
- 毕业设计(论文)-广州市番禺区东涌镇排涝规划及泵站初步设计.docx
原创力文档

文档评论(0)