- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Cumulus:数据中心科学云 CARMEN:e-Science云计算 RESERVOIR:云服务融合平台 TPlatform:Hadoop的变种 P2P环境的MapReduce Yahoo云计算平台 微软的Dryad框架 Neptune框架 语义分析应用 生物学应用 数据库应用 地理信息应用 商业应用 医学应用 社会智能应用 Anti-Spam Grid:反垃圾邮件网格 CloudAV:终端恶意软件检测 AMSDS:恶意软件签名自动检测 CloudSEC:协作安全服务体系结构 习题 阅读精选 * * 第10章 云计算研究热点 提 纲 ? 云计算体系结构研究 ? 云计算关键技术研究 ? 编程模型研究 ? 支撑平台研究 ? 应用研究 ? 云安全研究 --主要为科学计算应用程序提供虚拟机、虚拟应用程序和虚拟计算平台 --Cumulus前端节点是Globus虚拟工作空间服务的再实现 --OS Farm为云用户提供了两个界面:用户能输入虚拟机镜像构建参数的Web界面和能通过wget访问的HTTP服务 --两种访问方式:一种是Globus虚拟工作空间服务客户端,另一种是通过网格计算工作台或网格门户 --该项目供神经学家共享、整合、分析数据 --体系结构 -用户,通过Web浏览器和富客户端访问CARMEN系统 -领域内的特定服务 -e-Science核心云服务(工作流、数据管理、服务管理、元数据管理和安全组件 ) -核心云服务 (基本的存储和处理 ) --IBM与SAP、Sun Microsystems及其他若干欧洲科研机构联合开展一项名为RESERVOIR的云计算计划,欧盟投资经费为1700万欧元。该项目旨在建立一种“基于服务的网络经济模式” --RESERVOIR研究了当前无法实现的商业服务对系统性能的需求。RESERVOIR在公开标准基础上建立一个具有可扩展性、灵活性、可靠性的框架以提供云计算服务 --体系结构 -PC集群层 -云计算平台基础设施层 -数据处理应用层 --最大特点 把大小不变的GFS固定文件块变为大小可变的TFS文件块,改进使得数据的分发和读取有更好的性能 --P2P-MapReduce体系结构包含三个基本角色:用户(User)、主节点(Master)和从节点(Slave)。主节点和从节点形成了两个逻辑上的P2P网络M-net和S-net --主节点失效时的作业提交和节点失效管理流程,从中可以看出P2P-MapReduce的工作过程 --应用需求 (1)在相同的硬件和软件基础设施上支持各种不同类型的应用程序 (2)需要根据用户的需求动态的提供计算资源 (3)需要很高的安全保证 (4)云中的系统必须易于操作 (5)提供简单易用的API接口 (6)采用资源调度和负载均衡技术,快速高效地为用户提供服务 --平台包括三层服务,分别是基于内容的边缘服务、消息服务和核心服务 --主要用来构建支持有向无环图(Directed Acycline Graph,DAG)类型数据流的并行程序,根据程序的要求进行任务调度,自动在各个节点上完成任务 --Dryad的执行过程可以看做二维管道流的处理过程 -二维Dryad管道模型定义了一系列操作,包括建立新的节点、在节点之间加入边、合并两个图或是对任务的输入和输出进行处理等 --基础结构中间件,通过提供标准系统的构建来保证可扩展性和有效性,同时减少服务结构的灵活性 --优点 -信息独立和用户独立,通过一个包含RPC-like访问方式的服务访问接口来压缩应用级别的网络服务。通过服务访问一个模块,可以在数据分区上实现独占 提 纲 ? 云计算体系结构研究 ? 云计算关键技术研究 ? 编程模型研究 ? 支撑平台研究 ? 应用研究 ? 云安全研究 ?对大规模的RDF三元组进行语义推理和查询的速度之慢已深受广大研究者关注 ?解决方案 --应用Google的MapReduce框架来实现大规模分布式查询和推理,将RDF图分解成能够被计算节点处理的小单位 --RDF分子法提供一个处于RDF图和三元组之间的中间化的粒度方法,由于RDF分子的自身缺陷,使得其性能受到限制,提出了将RDF进行扩展的方法,包括层次扩展和顺序扩展,以克服其缺陷 ?Hadoop实现了两个算法来研究解决生物信息计算的问题:一个是基本的局部相似性基本查询工具(Basic Local Alignment Search Tool,BLAST);另一个是基因集合增强分析(Gene Set Enrichment Analysis,GSEA) --BLAST:一个用来比对
文档评论(0)