- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于DSP和模板匹配算法的实时图像跟踪处理系统的优化设计
本文详细介绍了基于高性能TigerSHARC DSP 处理模块和模板匹配算法(templatematching)的实时图像跟踪处理系统的优化设计方法;深入分析了SAD 操作中涉及到的地址对齐问题,提出了一种优化的设计方案,将并处理效率提高20 倍,并在实际的实时图像跟踪系统中得到应用。
1. 引言
随着电子技术的不断进步,目前越来越多的实用数字图像跟踪系统采用高性能DSPCOST 模块实现快速构建实时处理原型[1]。在众多型号的DSP 处理芯片中,TigerSHARC 系列DSP 处理器具有大的定点、浮点处理能力,成为目前世界上最快的浮点DSP 处理器,由于其具有强大的可扩展能力,TigerSHARC DSP 处理器也一直引领可扩展并行多DSP 实时处理系统的发展方向,被称为“多DSP 系统实现的标准”[2]。同时,TigerSHARC DSP 处理器对字节数据的处理提供了良好的支持,例如,支持基于字节的SAD(SUM-ABS-Difference)操作,非常适合构建实时图像处理系统。但由于严重的地址对齐问题,需要对系统进行优化设计,以实现在满足严格的实时性要求的条件下,限制系统规模,降低系统成本。
2. 实用实时图像跟踪处理系统
2.1 实时图像跟踪处理系统组成
首先给出实用实时成像处理系统的结构组成框图,如图1 所示,系统包括PMC 视频采集模块,TigerSHARC DSP 处理模块(内部集成4 片TigerSHARC DSP 处理器),cPCI 工控机主板,控制手柄和VGA 显示器等。视频采集板的输入为PAL 制式黑白图像信号,输出768×288×8-bit 的数字图像数据并通过TigerSHARC DSP 专用的LINK 接口以每场20 毫秒的间隔送至TigerSHARC DSP 处理模块进行模板匹配(template matching)检测算法。之后, DSP 处理模块在原始图像上叠加目标信息,通过cPCI 工控机主板传送到VGA 显示器进行显示。国家 863 计划:基于空天平台的实时数据处理技术(2006AA701415)
2.2 模板匹配算法
模板匹配算法是在一幅图像场景中检测目标的基本算法,将已知的目标图像模板在一幅未知图像场景中滑动,并与对应的未知场景图像块进行比较,如果结果足够接近,就将该图像块标识为目标。一般采用目标模板与未知场景图像块之间的各像素值的差异绝对值之和的形式来度量其接近程度。如下式所示, 其中各像素之间的运算操作定义为SAD(SUM-ABS-Difference),整个过程如图2 所示。某目标模板T,为M×N 维的像素阵列,以像素为单位在未知图像场景中沿水平方向和垂直方向依次滑动。每滑动一步,T 即与未知图像场景中对应的待检测像素矩阵S 进行如式1 所示的SAD 操作,并将所得结果D(i,j)作为接近程度的度量(Difference measure)存入度量矩阵D,其中,S 是与T 同样大小的像素矩阵。
2.3 SAD 模板匹配中的地址对齐问题
TigerSHARC 处理器的ALU 提供了对SAD 操作的指令支持,如图3a 所示。在一个时钟周期(3.3ns/300MHz/ADSP-TS101S)内,单个ALU 可以通过指令PR+=ABS(BRmd-BRnd)完成模板T 中8 个像素的SAD 操作,其中PR 为处理器ALU 中的64-bit 累加器,用于存储SAD 操作中图像字节数据的累加结果。BRmd 和BRnd 均为32-bit×2 的寄存器对,分别读取T 和S 中的8 个对应像素字节数据。因为TigerSHARC DSP 处理器为双核结构,具有两个ALU,所以,其单周期最多可以完成模板T 中16 个像素的SAD 操作。显而易见,使TigerSHARC DSP 处理器的指令流水线中不间断地执行SAD 指令是获得其峰值处理能力的必要条件,而其ALU 从内存取操作数时产生的地址对齐问题则是制约处理效率提升的主要瓶颈。
如图 3b 所示,SAD 指令执行时前,两个ALU 分别需要从内存读8 个字节目标模板数据和8 个字节待检测场景图像数据至内部寄存器,且要求该数据存放首地址须为64-bit 对齐,否则会导致内部总线访问异常。T 与S 虽然是同样大小的像素矩阵,但其大小一般远大于16 个字节,在T 内地数据地址是连续的,而S 作为从场景图像中切割出的一部分,其地址通常不连续。同时,随着T 在场景图像中不断以字节为单位逐行滑动,地址对齐问题所造成的效率损失会更加突出,势必需要对非对齐的数据地址进行计算,零散字节数据的收集合并(bytes adjust and merging),以及非常复杂的多重
您可能关注的文档
最近下载
- 洋务运动和边疆危机课件--2025--2026学年统编版八年级历史上册.pptx VIP
- 出国旅游英语之美国地理文化和人民英文介绍Geography and People.ppt VIP
- GB50775-2012 ±800KV及以下换流站换流阀施工及验收规范.pdf VIP
- 高中物理课件:重力势能.pptx
- 粮食质量安全监管办法培训与解读课件.pptx VIP
- 2025中国成人呼吸系统疾病家庭氧疗指南.pdf VIP
- GB50260-2013 电力设施抗震设计规范.docx VIP
- 纪念革命英雄孙中山生平介绍PPT课件(带内容).pptx
- 美国地理与美国人民Geography and People.ppt VIP
- 82205综采工作面设计说明书.pdf VIP
文档评论(0)