- 19
- 0
- 约1.76万字
- 约 20页
- 2018-01-18 发布于河南
- 举报
Hadoop平台语言模型训练基础
谢谢! “云计算”(Cloud Computing)是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。 云的好处,成本和弹性。 处理“大数据”(Big Data)。 存储空间、带宽和计算能力都会得到“永久性的扩充”。 * Hadoop Common:支持其他Hadoop子项目的通用工具。 HDFS:向应用数据提供高吞吐量访问的分布式文件系统。 MapReduce:用于对计算群集上的大型数据集合进行分布式处理的软件框架。 HBase:支持大型表格结构化数据存储的可伸缩、分布式数据库。 Hive:提供数据汇总和随机查询的数据仓库基础设施。 Pig:用于并行计算的高级数据流语言和执行框架。 Chukwa:管理大型分布式系统的数据采集系统。 ZooKeeper:用于分布式应用的高性能协调服务。 * 元数据(metadata):data about data (关于数据的数据)。描述数据及其环境的数据。 Hadoop的副本存放策略是:在与客户端相同的节点上放置第一个副本;第二个副本放置在与第一个不同的随机选择的机架上,第三个副本被放置在与第二个相同的机架上。 NameNode使用事务日志(EditLog)来记
您可能关注的文档
- 数字和倍数的表示.ppt
- EDS差示扫描量热法.ppt
- 示功图分析培训版.ppt
- Flipchip常用英语.ppt
- 第2章5_用整体坐标表示单元刚度矩阵.ppt
- 第四讲 java控制语句.ppt
- validator验证api.docx
- java的异常处理 exception.ppt
- 320飞机发动机损伤的安全提示.ppt
- 软件测试技术-chap8.ppt
- 2024-2025学年湖南省邵阳市新宁县回龙寺镇人教版一年级下册期中测试数学试卷.docx
- 2024-2025学年山东省德州市平原县王杲铺中小、王凤楼中小、腰站镇中小青岛版一年级下册3月月考数学试卷.docx
- 第四单元 课题3 物质组成的表示-初中化学新教材预习学案(人教版2024九年级上册).docx
- 2024-2025学年山东省济宁市梁山县人教版一年级下册期中测试数学试卷.docx
- 2024-2025学年山东省德州市德州经济技术开发区长河小学等校青岛版一年级下册期中考试数学试卷.docx
- 2026《基于国产开源单片机GD32VF103的输变电设备物联网传感器设计》8300字.docx
- 2024年中考道德与法治真题完全解读(北京卷).docx
- 2026《基于机器视觉识别的工件边缘曲线重构方法分析》9000字.docx
- 课时9.4 物体的浮与沉【一大题型】八年级全一册物理(沪科版2024).docx
- 2024-2025学年广东省江门市开平市人教版一年级下册期中综合素养评价数学试卷.docx
最近下载
- 057 肖祥锐的心灵秘籍 心灵魔术教学书籍 中文 完整版_超级魔术学习系列.pdf VIP
- (高清版)DG∕TJ 08-2421-2023 装配式部分包覆钢-混凝土组合结构技术标准.pdf VIP
- 发热待查诊治专家共识(2026版)解读.pptx VIP
- (共108页PPT)7 全球联系的初步建立与世界格局的演变.pptx VIP
- The Principle of Auditing(西南财经)中国大学MOOC慕课 章节测验客观题答案.docx VIP
- 2024人教版九年级化学下册全册知识点总结.pdf VIP
- 波谱解析 核磁共振氢谱 HNMR.ppt VIP
- 往年高考英语听力真题.pdf VIP
- 《全球联系的初步建立与世界格局的演变》PPT课件.pptx VIP
- 具有假体腔的动物腹毛动物门轮形动物门动吻动物门线虫动物.PPT VIP
原创力文档

文档评论(0)