- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图像灰度匹配在多核环境下优化
图像灰度匹配在多核环境下优化摘 要: 随着计算机技术的不断发展,图像匹配已经成为图片处理的一个重要部分。在图像匹配中,图像的灰度匹配虽然具有匹配精度高的优点但却需要大量的计算时间,且计算时间随着使用模版的增大而大幅度增长。文章在多核的环境下使用内存优化与处理器亲和力优化方法来解决计算时间长的问题。实验结果表明,使用并行技术并结合内存优化与处理器优化方法可大幅度减少计算时间、提高缓存的命中率、避免乒乓效应的产生使并行程序的加速比与并行效率有所提高。
关键词:图像灰度匹配;多核;内存优化;处理器亲和力
中图分类号:TP301.6 文献标识码:A DoI: 10.3969/j.issn.1003-6970.2012.06.040
【Abstract】with the rapid development of science and technology, image matching technology has become very important in
the modern image processing. In image matching filed, image gray matching is a method with high accuracy but cost a lot of time on calculation. and it will cost more time when template is too large. Point to this problem, parallel computing technology based on Cache optimization and CPU affinity optimization in multi core environment are used in this paper to reduce the computation time. Test show that Cache optimization and CPU affinity optimization can reduce the matching time in image gray matching through improving the Cache hit rate.
【Key words】Image grey match; multi core; Cache optimization; CPU affinity;
随着科学技术的快速发展,图像匹配技术已经成为近代图像处理领域中一项重要的技术,并在计算机视觉、导弹地形匹配、飞行器巡航制导、医学图像配准、资源分析、航空摄影测量等多个领域得到了广泛的应用。因此,对图像匹配技术进行研究具有十分重要的理论意义和现实意义。
目前图像匹配的方法有很多,根据使用的匹配特征可大致分为两类[1]。他们分别是基于图像灰度信息的匹配方法和基于图像特征的匹配方法。其中基于图像灰度信息匹配方法包括归一化互相关匹配、模板匹配、快速傅立叶算法、投影匹配、序贯相似性匹配、平均绝对差匹配、图像不变矩匹配等多种方法。本文讨论的是基于多核的使用模板匹配方法进行图像灰度匹配的相关研究。
匹配的图像被称为模板,记为T(m,n),大小为M×M。被匹配的图像记为S(m,n),大小为N×N,其中被匹配图像被模板覆盖的部分称为子图,记为S(m,n)i,j,在陌生图像中起始位置为(i,j),由模板从源图像左下角进行逐点匹配。 示意图1如下:
由上面(1)式可知D(i,j)越小,S(m,n)i,j与T(m,n)匹配的精确度越高,所以当D(i,j)取得最小值时,S(m,n)i,j与T(m,n)获得最高精确匹配。再由(3)可知,前两项为模板的平方和与模板对应的陌生图像子图的平方和。第三项S(m,n)i,jT(m,n)则可表示模板与子图的相互关系,当S(m,n)i,jT(m,n)最大是可使得D(i,j)最小从而使得S(m,n)i,j与T(m,n)匹配的精确度最高。因此可以定义相关函数:
的2个线程绑定到CPU0,CPU1 (CPU0 表示第一个核心,CPU1 表示第二个核心),运行结果如图3 所示为在4线程情况下,不使用CPU 亲和力与使用 CPU 亲和力的程序平均运行时间比较图。
文中针对多核编程环境的特点,在使用传统的多线程并行编程技术的基础上,介绍了在图像匹配中基于 Cache 优化和CPU 亲和力的多线程程序优化思路,在实际实验中,单线程原始程序平均耗时 110.4秒,最快的4线程优化方案为33.8 秒。基于 Cache和CPU 亲和力的优化方法具有一定的通用性,在软件开发过程中,可以根据实际情况采用这两种
文档评论(0)