面向新型硬件的大数据管理问题与挑战—面向新型硬件的大数.PDFVIP

面向新型硬件的大数据管理问题与挑战—面向新型硬件的大数.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向新型硬件的大数据管理问题与挑战 —面向新型硬件的大数据管理研讨会 1. 引言 2016 年12 月9 日,由中国科学院计算技术研究所主办,中国人民大学承办的“面向新 型硬件的大数据管理”研讨会,在中国人民大学逸夫会议中心召开,并获得圆满成功。本次 研讨会的主题包括新型硬件的特性,大数据管理的挑战,和如何更好地利用新型硬件为大数 据管理服务等内容。会议汇集国内外知名专家和学者,进行了为期半天的深入研究和探讨。 本次会议由中国人民大学孟小峰教授、中国科学院计算技术研究所陈世敏研究员担任大 会主席。Oracle 高级研究员龚玮薇,中国科学院计算技术研究所研究员陈云霁,清华大学副 教授都志辉,香港科技大学副教授罗琼,中国科学院计算技术研究所研究员陈世敏等专家学 者出席了会议,介绍了最新的前言技术和发展动态,分别做了精彩的报告。 2. 问题与挑战 “面向新型硬件的大数据管理”研讨会的主题报告新型硬件的特性,大数据管理的挑战 和如何更好地利用新型硬件为大数据管理服务等内容。包括软硬件协同设计(Co-Design), CPU-GPU 科学数据管理,和大数据存储与量化瓶颈分析等内容。 下面分别从各个专家学者的角度,介绍面向新型硬件的大数据管理的问题和挑战。 2.1 软硬件协同设计(Co-Design) How hardware-software co-design is redefining data processing? (龚玮薇 ·Oracle) 目前的主流数据库系统都运行在通用CPU (Intel,ARM)中。随着大数据的到来以及用 户查询的多样化,大型数据库系统必须运行在分布式的环境中。大规模的CPU 集群会造成 严重的散热问题,从而限制了数据库的规模和运行速度,也会带来大量的能耗开销。在此背 景之下,Oracle 公司基于Sun 公司的SPARC 芯片,设计了一款为数据库系统专门定制芯片, 这将会给数据库的操作带来很大的能效提升。 来自Oracle 的高级研究员龚玮薇介绍了这款基于SPARC 芯片 (DAX)的设计架构。这款 芯片总体设计目标是为OLTP 查询提供高性能和高可用的底层硬件支持。通过分析SQL 查询, 将SQL 执行计划分发给集成了通用CPU 以及DAX 的硬件中。 神经网络指令集 (陈云霁 ·中科院计算所) 智能是人类最主要的日常脑力活动,比如知觉、记忆、学习、语言、思维和问题解决等。 相应的,智能应用也成为计算机最主要的负载之一,已渗透到云服务器和智能手机的方方面 面。为了完成这些任务,出现了深度学习技术,它借鉴人脑的工作原理,利用神经元和突触 - 14 - 的处理。 中国科学院计算技术研究所陈云霁团队提出了首个神经网络指令集 Cambricon 。 Cambricon 直接面对大规模神经元和突触的处理,采用数据级并行 (Data-level Parallelism), 定制矢量/矩阵指令(Customized Vector/Matrix Instructions)和片内暂存器(On-chip Scratchpad Memory)设计,提供控制类指令、数据传输指令、计算指令和逻辑指令,其中,逻辑指令 针对向量和变量,而数据传输指令、计算指令可以针对矩阵。这样的设计使得一条指令即可 完成一组神经元的处理,并对神经元和突触数据在芯片上的传输提供了一系列专门的支持。 2.2 CPU-GPU 科学数据管理 GPU 加速的引力波数据处理 (都志辉 ·清华大学) 在物理学中,引力波是指时空弯曲中的涟漪,通过波的形式从辐射源向外传播,这种波 以引力辐射的形式传输能量。爱因斯坦在一百多年前就语言了引力波的存在,其最大限度携 带博远信息,是认识了解宇宙的绝佳手段。为更好的了解引力波并对其进行相应的研究,清 华大学都志辉老师做了GPU 加速的引力波数据处理的报告。 引力波数据的处理流程如下:首先将数据打包,传输至数据处理中心,然后通过实时数 据处理流水线,进行数据白化等预处理、模板滤波和一致后处理与定位三个步骤,得到引力 波信号的位置信息,最后指引其它电磁设备及时做后续定向观测。 Cross-Matching Big Astronomic Catalogs on Heterogeneous Clusters (罗琼 ·香港科技大学) 在天文学中,交叉证认是用来对天文光学望远镜拍下来的星空图片与历史记录的

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档