- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于 FPGA 的稠密光流计算系统#
马骏,柴志雷,王芝斌,钟传杰**
(江南大学物联网工程学院 轻工过程先进控制重点实验室(教育部),江苏 无锡 214122)
5
10
15
20
25
30
35
40
摘要:高质量的稠密光流算法计算复杂度很高,因此计算速度成为制约其在实际系统中应用
的重要原因。针对这一问题,利用现场可编程门阵列(FPGA)的细粒度并行特性,实现了一
种高质量的稠密光流算法 CBG(Combined- Brightness-Gradient)的硬件加速器。实验结果表
明,在 FPGA 工作频率 200MHz、计算全部像素对应的光流信息的情况下,该系统处理分辨
率为 316×252 的图像序列的帧频可达 40fps。
关键词:流计算;超松弛法;可编程逻辑门阵列;并行计算;实时性
中图分类号:TP391
FPGA-based dense optical flow computing system
MA Jun, CHAI Zhilei, WANG Zhibin, ZHONG Chuangjie
(College of Internet of Things, Jiangnan University, Key Laboratory of Advanced Process Control
for Light Industry (Ministry of Education), Wuxi Jiangsu 214122, China)
Abstract: High-quality algorithms for dense optical flow computation are computationally
expensive, which limits their usability in real-world applications. In order to solve this problem,
the hardware accelerator is applied for a high-quality dense optical flow algorithm by CBG
(Combined-Brightness-Gradient) model, based on fine-grained parallelisms of FPGAs (Field
Programmable Gate Arrays). Experimental results show that 40 fps can be processed in time when
the working frequency is 200MHz and the image size is 316×252. Furthermore, optical flow fields
for all pixels instead of selected areas are computed for designing.
Key words: optical flow computation; successive over relaxation method; FPGA; parallel
computing; real-time performance
0 引言
光流法广泛使用在运动目标检测、跟踪和行为分析等视频/图像处理领域。自 Horn 和
Schunck 提出基本的稠密光流计算(HS)模型[1]以来,可计算稠密光流的计算模型得到不断的
发展与完善。然而高质量的光流算法意味着较高的运算复杂度和较差的实时性,例如在主频
为 3.06GHz 的 Intel Pentium 4 处理器上处理 316×252 的图片序列时,每帧需要时间 1.2s[2],
显然无法满足大多数实际应用的实时性需求。为提升光流法的计算速度,许多研究着眼于简
化运算复杂度或采用 GPU 加速。如文献[3]中通过加入多重网格算法降低 CPU 上的运算复
杂度,文献[4]中采用了 GPU 并行计算。尽管在一定程度上提升了计算性能,但前者牺牲了
运算精度且实时性表现依然不理想;而后者则有较高的功耗,限制了其在低功耗场景中的应
用。
现场可编程门阵列 (Field Programmable Gate Arrays, FPGA)支持细粒度并行计算,能以
较低的运行频率与功耗实现高的处理性能,有助于进一步提升处理速度并满足功耗需求。已
有一些基于 FPGA 的光流算法加速方面的研究如文献[5][6],但目前多数都只实现了基本的
HS 光流模型。更高质量的光流算法的 FPGA 加速方面的工作尚未见报到。此外,上述研究
基金项目:国家自然科学基金61202312);高等学校学科创
您可能关注的文档
- 4种农林生物质热解特性及动力学研究.doc
- 48份分蘖洋葱种质资源遗传多样性的SSR和AFLP标记分析.doc
- 80 t转炉熔池混匀行为的物理模拟研究.doc
- 105μm芯径GI多模光纤中受激布里渊散射及受激布里渊放大模式特性研究.doc
- AZ31+Y+Sr镁合金盒形件超塑气胀成形研究.doc
- CH4-H2O-NaCl包裹体V-x参数的准确计算.doc
- CoMnCrSi霍伊斯勒合金的结构稳定性和半金属性研究.doc
- GDQR求解非均质变截面圆拱的振动特性.doc
- Klotho基因在残余肾模型大鼠肾脏的表达及淫羊藿、黄芪、大黄复方的干预作用研究.doc
- LRRC4增强替莫唑胺的敏感性促进U87细胞凋亡.doc
文档评论(0)