基于媒体数字信号处理器的流预取机制.pdfVIP

基于媒体数字信号处理器的流预取机制.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于媒体数字信号处理器的流预取机制

基于媒体数字信号处理器的流预取机制 叶霞 辛愿 刘勇 刘鹏 浙江大学 信息与电子工程学系 ACA2012 西安 内容 背景 相关工作 流预取机制 评估方法 实验结果 结论 ACA2012 西安 背景 数据预取 隐藏访存延迟,降低cache缺失所带来的延时 数据在实际使用前预先取到距处理器更近的存储结构中,在发生cache缺失 时数据已被传送进处理器,减少因数据传送而停顿流水线的时间,从而降低 发生cache缺失所引起的开销 数据预取在商用处理器中的应用 Power4 ,UltraSPARCIII及Blue Gene/Q TMS320C66x 采用流预取引擎,与C64x+相比,性能提升40% YHFT-DX ,预取与非阻塞cache 的结合,提出一种针对高性能DSP 的一级数 据cache 的优化策略,使访问cache缺失引起的流水线停顿从8拍降为2拍 本文目的 针对MediaDSP64处理器存储结构,设计一种针对MediaDSP64 的一级数据 cache优化策略,探索适合于MediaDSP64 的预取策略—基于可变步长的流预 解决方案 ACA2012 西安 相关工作1 数据预取划分 软件预取 硬件预取 表1 软件/硬件预取优缺点比较 针对MediaDSP64处理器,选择 优点 缺点 增 加 额 外 指 令 开 硬件预取 销,需要准确计算 软件预取需要在应用程序中插 软件 结合程序特性,预取 预取的地址,预取 算 法 在 编 译 时 完 入预取指令,修改编译器,实 预取 准确度高 成,不能随程序运 现过程较为复杂 行的动态变化而变 硬件预取准确率虽然不及软件 没有指令开销,不需 化 基 于 访 存 历 史 信 预取,但是其不需要扩展原有 硬件 要编译和程序员支 息,需额外的硬件 预取 持,对各种程序的自 的指令集,不用程序员或编译 开销 适应能力强 器的干预,通过在处理器内部 增加硬件预取电路实现 ACA2012 西安 相关工作2 硬件预取 顺序预取 预取当前被访问cache块的下一块,简单易行 不命中预取和带标记预取

文档评论(0)

ailuojue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档