互联网数据工程重点试验室-高性能.PPT

互联网数据工程重点试验室-高性能

This is hard 如何判断一个大规模图上的操作是可以并行处理的 如何设计一个适合并行处理大规模图的计算模型 如何开发科处理大规模图上的常用算法的通用系统 大图并行的解决方案 高可扩展并行图处理系统 研究内容 本课题针对高可扩展并行图处理系统在海量复杂生物数据的分析组装的应用,力图从以下3个方面展开研究: 可扩展的图算法数学抽象:使用基于群论的代数系统来抽象图算法,使得图算法上的边和点对应于计算机中的计算操作和访存地址,并将该读写操作规约为原子操作,使得多个这样的互斥的原子操作可以同时并发执行。 可扩展的并行计算模型: 基于子集同步全局异步的并行计算模型。 可扩展的并行图处理框架:基于子集同步计算模型,开发可自动挖掘潜在并行子集,自动回避读写冲突,尽可能的提高系统效率的并行图处理框架。 在以上三方面进行深入的研究后,开发性能优异的系统原型系统以运用于海量复杂生物数据的组装分析。 研究目标 本课题将围绕高可扩展图处理系统的研究和开发,以海量复杂生物数据上的组装分析为应用,期望达到如下目标: 使用代数系统的半群来抽象在大规模图结构上的现实问题。 提出计算模型来处理一部分紧耦合难并行的大规模图算法。 开发新的大规模图处理框架,其可处理的最大数据量可到100T, 图顶点规模可达到200G,系统可运行于万颗核心。 基于该图处理框架开发的生物数据的组装应

文档评论(0)

1亿VIP精品文档

相关文档