- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE
PAGE 1
FPGA与GPU计算存储单位功耗性能
1 借助应用专用编程定制可编程硬件,获得更高性能 2 将计算任务从服务器卸载到存储器件,释放 CPU 资源 3 数据与计算共址,降低数据传输需求 这种新奇的方法前景光明。不过,您应依据详细用例评估这种方法,考量性能、成本、功耗和易用性。性价比和单位功耗性能在选择加速硬件评估时,占据主要比率。在本文中,我们将研讨单位功耗性能。 计算存储功耗比较 在这个场景中,我们将比较以 CSV 数据读取用例为主的三种(工具):(英伟达) GPUDirect 存储 和RA(PI)DS存储,以及基于(赛灵思)技术的(三星) SmartSSD 存储。CSV 读取在计算密集型流水线中起着重要的作用。 在下文中,我们将性能定义成 CSV 的处理速率,或处理“带宽”。我们先快速回顾一下三种系统的运行方式。 英伟达 GPUDirect 存储 端到端满意分析和 AI 需求 将 GPU 用作计算单元,紧贴基于 NVMe 的存储器件布局 (GPUDirect) 使用 CUDA 进行编程 (RAPIDS) 英伟达用其 CSV 数据读取技术衡量相对于标准 SSD 的性能提升。结果如图 1 所示。使用 1 到 8 个加速器时,对应的吞吐量是 4 到 23GB/s。 三星 SmartSSD 驱动器 将赛灵思 FPGA 用作计算单元 与存储规律内嵌驻留在同一个内部 PCIe 互联上 通过编程在存储平台上开展运算 赛灵思数据分析解决方案合作伙伴 Bigstream 与三星合作,为 Apache Spark 设计加速器,包括用于 CSV 和 Parquet 处理的 IP。SmartSSD 的(测试)使用单机模式的 CSV 解析引擎,以便开展比较。结果如图 2 所示,使用 1 到 12 个加速器时,对应的吞吐量是 4 到 23GB/s,同时也给出英伟达的结果(使用 1 到 8 个加速器)。请留意,本争论中的全部结果都按 x 轴上的加速器数量进行参数化。 这些结果令人兴奋,但在选择您的解决方案时,请务必将功耗状况纳入考虑。 单位功耗性能比较 图 3 显示了将功耗考虑在内后的分析结果。它们代表单位功耗达到的性能水平,依据上述争论中引用的相关材料,给出了以下假设: (Te)sla V100 GPU:最大功耗 200 瓦 SmartSSD 驱动器 FPGA:最大功耗 30 瓦 在这个场景下,计算表明,在全部使用 8 个加速器的状况下,SmartSSD 的单位功耗性能比 GPUDirect Storage 高 25 倍。 最 终 思 考 计算存储的优势在于能增加数据分析和 AI 应用的性能。然而,要让这种方法具备可实际部署的力量和有用性,就必需在评估时将功耗纳入考虑。 针对用于 CSV 数据解析的两种不同的计算存储方法,我们已经提出按功耗参数化的吞吐量性能曲线。结果显示,在使用相像数量的加速器进行比较时,SmartSSD 驱动器的单位功耗性能优于 GPUDirect存储方法。 GPUDirect 是英伟达通过 NVIDIA DGX-2 应用平台供应的讨论系统。 三星 SmartSSD 驱动器是一种可部署的量产型 PCIe 可插拔平台,现在已经通过赛灵思及分销商供货。 责任
您可能关注的文档
- FPGA相对于MCU的主要优势在哪.docx
- FPGA中同步异步时钟域信号的处理.docx
- IIR数字滤波器设计-在FPGA上实现任意阶IIR数字滤波器.docx
- InnovateFPGA全球创新设计大赛火热报名中 寻基于英特尔边缘FPGA解决方案.docx
- InnovateFPGA全球创新设计大赛火热报名中 寻基于英特尔边缘FPGA解决方案_1.docx
- Lattice基于三星28nm FD-SOI平台推出FPGA产品加强边缘AI能力.docx
- MPSOC开发板教程之HELLO WORLD.docx
- multiboot什么意思 MultiBoot的功能简介、流程介绍.docx
- multiboot什么意思 MultiBoot的功能简介、流程介绍_1.docx
- RIGOL“凤凰座”ASIC芯片组的前世今生.docx
- 专卖店促销员销售与成交技巧培训课件(34P).pptx
- 红色商务风新员工入职销售技巧知识培训课件(34P).pptx
- 专卖店商场销售员销售与成交技巧培训课件(34P).pptx
- 小区物业保安法律知识培训课件(28P).pptx
- 专卖店销售员轻松成交技巧培训(34P).pptx
- 轻松成交客户新员工入职通用销售技巧知识培训(34P).pptx
- 2024年初级《银行业法律法规与综合能力》考前必刷必练题库500题(含真题、必会题).docx
- 2024年“新安法知多少”知识竞赛题库及答案(最新版).docx
- 2024年30秒毕业生面试工作自我介绍.docx
- 2024年《医务人员礼仪培训》心得体会.docx
文档评论(0)