网站大量收购闲置独家精品文档,联系QQ:2885784924

EDMA3在JPEG2000小波数据传输中应用.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
EDMA3在JPEG2000小波数据传输中应用

EDMA3在JPEG2000小波数据传输中应用   摘 要:JPEG2000图像压缩算法分为小波变换、嵌入式块编码和优化截断三个模块,三个模块间存在数据交互,为满足系统的实时性要求,本文采用TMS320C6678新型DSP,基于EDMA3实现了模块间的数据后台传输,并通过EDMA3的相关配置,在位平面扫描开始前,完成了小波数据传输和数据结构的优化调整,减少了位平面扫描的小波数据读取次数,避免了不必要的系统开销。 关键词:JPEG2000;多核DSP;TMS320C6678;并行方案;EDMA3 中图分类号:TP274 文献标识码:A 文章编号:1674-7712 (2013) 22-0000-02 卫星遥感图像随着分辨率的提高,产生的海量数据对存储和传输提出了挑战,为了获得高压缩比、高质量的实时图像压缩,JPEG2000静态图像压缩标准在卫星遥感图像实时压缩领域得到了广泛应用[1-3]。针对JPEG2000编码算法复杂度高、运算量大的特点,采用高性能多核DSP(如TMS320C6678)实现并行图像压缩,能有效提高图像的压缩性能。 TMS320C66X[4]系列采用梯形多内核架构,不但最大限度地提高了片上数据量的吞吐量,而且还可以消除可能出现的瓶颈问题,释放了多内核的强大功能,在性能、精度、功耗、实时等方面打破了图像压缩应用中“不可兼得”的局面。特别是8核TMS320C6678每个内核都同时具备定点和浮点运算能力,运行速率能达到10GHz。 JPEG2000算法分为小波变换(Transform)、嵌入式块编码(Embedded Block Coding,EBC)和优化截断(Optimized Truncation,OT)三个模块[5],EBC模块算法复杂、计算量大,适合采用TMS320C6678的多个核并行实现。通过对EBC算法的拆分,DSP采用EDMA方式进行数据搬移,可以使算法与数据搬移并行实现,不占用CPU,从而实现数据搬移的“零时间”[6]。为了提高位平面的扫描效率,在扫描前需对小波数据块的存储结构进行优化调整,增加了额外的开销。本文基于TMS320C6678使用EDMA3在实现数据搬移的同时实现了小波数据块结构的优化存储。 一、基于TMS320C6678的JPEG2000并行压缩方案 自从20世纪70年代末,第一片数字信号处理芯片问世以来,DSP就以数字器件特有的稳定性,可重复性,可大规模集成,特别是可编程性高和易于实现自适应处理等特点,给数字信号处理的发展带来了巨大机遇。德州仪器(TI)在2010年推出的TMS320C66X可扩展DSP器件可提供业界高性能的多核DSP。为使图像系统性能和效率达到最高,同时考虑系统容错等特性,我们选择了8核DSPTMS320C6678。 图1 TMS320C6678芯片片内结构 TMS320C6678具有8个速率高达1.25GHz的高性能DSP,每周期定点性能高达32MAC,每周期浮点性能高达16 FLOP。每个核配置了32KB的一级程序存储器L1P,32KB的一级数据存储器L1D,512KB二级局部存储器L2,并有多核共享存储空间控制器(MSMC)和多核导航来控制多核间的协同工作。(TMS320C6678芯片片内结构如图1所示) JPEG2000图像实时压缩设备采用基于TMS320C6678的硬件平台来实现,系统结构如图2所示。 图2 基于TMS320C6678的JPEG2000压缩系统结构 JPEG2000算法中Transform模块由Core0完成,EBC模块由Core1至Core5共同完成,Core6负责OT模块。各模块间的中间数据由外部SRAM存储,数据传输由EDMA3完成。经Transform模块处理产生的小波系数存储方式为按行存储。而EBC算法的位平面扫描方式为按列扫描(位平面扫面方式如图3所示),为充分发挥DSP数据存储器双字读写的潜能(其前提是地址连续),一次读写4个16位小波数据,需要对小波系数存储的结构进行调整。 本文基于EDMA3提出一种小波数据存储结构优化方案,如图4所示,图中的每个元素表示一个样本。其优化思想是,在EDMA3传输数据的同时将小波数据的存储结构由按行存储改为按列存储。优化后,每列的4个样本地址空间连续。 图3 位平面的扫描方式 图4 小波数据存储结构优化调整 二、基于EDMA3的数据搬移及存储结构优化 EDMA3是数字信号处理器用于快速数据交换的重要技术,具有独立于CPU的后台批量数据传输能力,能够满足实时图像处理中高速数据传输的要求。TMS320C6678采用最新的EDMA技术EDMA3,EDMA3控制器主要包括两部:EDMA3通道控制器和

文档评论(0)

docman126 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档