- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
............. 伏羲 Master 负责整个集群资源资源管理和调度,处理 Job/Service 启动、停止、failover 等生命周期的 维护。同时伏羲 Master 支持多用户额度配置、Job/Service 的多优先级设 置和动态资源抢占逻辑,可以说是飞天平台的“大脑”。伏羲对资源调度是 多维度的,可以根据 CPU、内存等系统资源,以及应用自定义的虚拟资源 对整个机群进行资源分配和调度。 Tubo 是部署在每台由伏羲管理的机器上后台进程,负责收集并向伏 羲 Master 报告本机的状态,包括系统资源的消耗、Master 或 Worker 进 程的运行、等待、完成和失败事件,并根据伏羲 Master 或者 Job/Service Master 的指令,启动或杀死指定的 Master 或 Worker 进程。同时 Tubo 还 负责对机器健康状况的监控,对异常 Worker(比如内存超用) 进行及时的清 理和汇报。 对于在线服务(Service),由伏羲 Master 负责 Service Master 的启动 与状态监控,处理相应 Service Master 的资源申请请求。Service Master 负 责管理 Service Worker 的任务分配、生命周期管理以及 failover 的管理。 对于离线任务(Job),伏羲 Master 负责 Job Master 的启动与状态监 控,处理相应 Job Master 的资源申请请求。Job Master 根据用户输入的 Job 描述文件,将任务分解成一个或以上的 Task,每个 Task 的资源申请、 Task Worker 的调度和生命周期维护由 Task Master 负责。 * * 飞天总体架构 * * 目录 飞天体系结构 分布式基础架构 分布式文件系统--盘古 任务调度--伏羲 集群监控--神农 飞天应用 什么是飞天? 飞天操作系统(项目代号“Apsara”)是阿里云公司自主研发的分布式计算平台。 它的主要设计目标是通过构建一套综合性的软硬件系统,使得用户(或应用系统)可以像使用一台计算机一样,便捷地使用数以千计的服务器的存储资源和计算资源。 飞天通过对软件系统的合理分层,使得“强调响应速度的在线服务(Online Service)”和“强调处理数据吞吐量的离线任务(Batch Processing Job)”可以共享一个物理集群的计算、存储和网络资源,以期大幅提示大规模集群的使用效率。 * 飞天体系结构 * 飞天体系结构-1 分布式系统底层服务:主要提供分布式环境下所需要的协调服务(女娲)、远程过程调用(夸父)、以及提供系统安全的钟馗模块。 分布式文件系统:主要提供一个海量的、可靠的、可扩展的数据存储服务,将集群中各个节点的存储能力聚集起来,并能够自动屏蔽软硬件故障,为用户提供不间断的数据访问服务。 * 飞天体系结构-2 任务调度:为集群系统中的任务提供调度服务,同时支持强调响应速度的在线服务(Online Service)和强调处理数据吞吐量的离线任务(Batch Processing Job) 集群监控和部署:对集群的状态和事件进行监控,对异常事件产生警报和记录;为运维人员提供整个飞天系统以及上层应用的部署和配置管理,支持在线集群扩容和应用服务的在线升级。 * * 目录 飞天体系结构 分布式基础架构 分布式文件系统--盘古 任务调度--伏羲 集群监控--神农 飞天应用 分布式基础架构 命名服务——女娲 女娲(Nuwa)系统为飞天平台提供高可用的协调服务(Coordination Service),是整个飞天系统的一个核心服务,它的作用采用类似文件系统的树形命名空间来让分布式进程互相协同工作。女娲系统与 Google 的 Chubby 和 Hadoop 的 ZooKeeper系统的功能与实现相似。 女娲服务存储了大量的键值对(Key-Value Pair) 女娲支持 Publish/Subscribe 模式 女娲还可以用来实现负载均衡 * 分布式基础架构 远程过程调用(RPC)——夸父 夸父(Kuafu)是飞天平台中负责网络通信的组件,它提供了一个RPC 的接口,简化编写基于网络的分布式应用。 异步调用:RPC 函数调用时不等接收到结果会立即返回;用户必须通过显式调用接收函数取得请求结果。 同步调用:RPC 函数调用时会等待,直到接收到结果才返回。在实现中,同步调用是通过封装异步调用来实现的。 * 分布式基础架构 安全管理——钟馗 飞天操作系统中安全管理的机制提供了以用户为单位的身份认证和授权,以及对集群数据
您可能关注的文档
- 2013年中医执业医师考试大纲——中医妇科学.doc
- 电子商务概论实验报告.doc
- 2014年妇产科主治医师考试强化练习3.doc
- 2014年公务员面试热点分类.doc
- 东北大学网络教育学院、电子科技大学网络教育学院.doc
- 东北大学网络教育学院滁州学习中心招生简章.doc
- 东财《金融企业会计》在线作业三套及答案.doc
- 东莞,深圳18001策划 (2).doc
- 东南大学 编译原理 课件 Cp6.ppt
- 2015年国监变更注册(房屋建筑工程 )继续教育考试题(76分).doc
- 人教新目标版英语九年级 中考模拟学情评估(三)(含答案).pdf
- 上海市风华中学2024-2025学年高三上学期9月阶段测试英语试题(无答案).pdf
- 统编版2024-2025学年语文六年级上册期末检测卷(有答案).pdf
- 人教新目标版英语九年级第二学期全册学情评估(含答案).pdf
- 内蒙古自治区巴彦淖尔市杭锦后旗第六中学2024-2025学年八年级上学期阶段性测试历史试题(解析版).pdf
- 湖南省娄底市涟源市部分学校2024-2025学年高一上学期9月月考语文试题 Word版无答案.pdf
- 湖南省衡阳市常宁市2023-2024学年七年级上学期期末考试英语试题.pdf
- 湖南省娄底市涟源市部分学校2024-2025学年高一上学期9月月考语文试题 Word版含解析.pdf
- 江苏省泰州市姜堰区城西实验学校2024-2025学年部编版九年级上学期月考历史试卷(原卷版).pdf
- 内蒙古伊金霍洛旗2022-2023学年七年级上学期期末考试英语试题.pdf
最近下载
- 2024年社会工作者《中级法规与政策》数字型考点.pdf VIP
- 竺乾威、朱春奎、李瑞昌:《公共管理导论》 第三章 组织.pptx VIP
- 建筑工程图集 B16G101-1:中英文双语版16G101-1.pdf VIP
- 图集规范-05N6井盖标准图集.pdf
- 室外消防钢结构楼梯拆除方案.pdf
- (精选施工方案)0141 民航总局办公楼加固整修工程.doc VIP
- 统编版小学语文四年级上册第三单元 观察 大单元整体学历案教案 教学设计附作业设计(基于新课标教学评一致性).docx
- 有关青岛市新建住宅质量保修手册.doc
- 同课异构省一等奖《同底数幂的乘法》教案 (省一等奖) .doc
- 连云港市新海高级中学2023-2024学年高一上学期10月月考数学试题(解析版).docx VIP
文档评论(0)