- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器视觉:视觉处理向3D跨越.doc
机器视觉视觉处理向3D跨越
上世纪70年代中,MIT人工智能实验室正式开设“机器视觉”课程,近半个世纪来机器视觉持续是一个非常活跃的研究领域,全球性的研究热潮,使得机器视觉获得了蓬勃发展,机器视觉在工业制造领域已获得了广泛的应用,比如在不适合人类工作的环境中,利用机器视觉代替传统人工测量/试;或用于需要高性能、精密机器视觉组件的专业设备制造领域。但总体来讲,机器视觉不仅依然一个相当新且仍有很多工作要做的研究领域,更是一个深藏无限潜力的金矿。
在此次采访中,大部分的厂商的关注焦点都更贴近大众生活相关,放在了消费电子、可穿戴产品、汽车ADAS以及智能化监控等领域。比如CEVA公司投资者关系与企业传播副总裁Richard Kingston就透露“我们已经将计算机视觉DSP授权许可予八家企业,其中包括三家移动领域的OEM厂商。”加拿大CogniVue公司业务开发副总裁Tom Wilson认为“可穿戴和汽车领域将存在非常强烈的增长机遇。”
视觉处理向3D跨越
随着谷歌正式发布了Project Tango后,3D机器视觉变得愈加热门。“我们认为消费领域3D处理的主要应用会是3D成像、自然用户界面(NUI)和3D视觉应用,比如PC、笔记本电脑、平板电脑、智能手机和其它消费类设备。”Kingston表示。
业界追寻3D视觉的最大原因还是为了解决2D机器视觉的固有局限,若能更好的实现在分割(分离近景和远景)、照明(用于人脸识别时)、相对位置(场景中的物体)等方面的功能,许多应用可以通过采用3D空间信息简化并提高视觉系统的精度和可靠性。
但无论是3D传感器(例如飞行时间法(ToF)相机)、或以2个2D图像传感器实现的立体传感器,他们对处理能力的要求都更高。“立体匹配(使用来自两个图像传感器输入)要求差异映射来生成3D景深图。这是一个非常困难的计算机视觉问题,学术界也积极研究来优化立体识别算法。”CogniVue公司业务开发副总裁Tom Wilson指出。每一种实现3D传感的方法都存在性能上的折衷,CogniVue目前在开发一种算法,能针对低成本3D传感器有效计算其视差图。
处理大量实时数据需要密集的计算能力。若是想实现稳定的3D传感地图是非常困难的,特别是对那些低功耗的设备来说。“CogniVue的APEX图像识别处理(ICP)技术能在电量有限的3D视觉应用中发挥关键作用。”他补充道。
对于系统设计者来说,设计能有效运行不同视觉算法的硬件是非常巨大的挑战。系统厂商选择图像/视频处理解决方案时,可以选择全部集中在CPU完成,也可以选择卸载一部分图像处理工作给GPU,或者专为图像处理增加硬件逻辑。在需要3D处理的应用中,GPU已经将系统的一部分,运行多种计算机视觉算法来协助通用CPU。
“i.MX6拥有强大的GPU运算能力,其3D引擎GC2000内部包含4个shader,可提供高达30GFLOPS的运算能力,支持OpenCL 1.1 EP。”飞思卡尔微控制器事业部亚太区市场营销和业务拓展经理李星宇介绍道,“此外,i.MX6Q还拥有一个专用的2D引擎(1Gpixel/s)和一个矢量图形处理引擎。”
此外,在一个软硬件无缝集成的图形开发环境中设计其3D视觉应用无疑会简化工程师的工作。“NI LabVIEW为3D视觉应用提供了全新双目立体视觉功能,用户可利用丰富的双目立体视觉功能来提取并利用LabVIEW应用的3D信息。”NI中国技术市场工程师崔鹏介绍道。
在图像采集领域,除了飞行时间法(TOF)3D成像(给目标连续发送光脉冲,然后用传感器接收从物体返回的光,通过探测光脉冲的往返飞行时间来得到目标物距离),还有一种是在工业制造检测方面获得比较广泛应用的3D激光传感器,区别就是3D激光传感器是逐点扫描,而TOF相机则是同时得到整幅图像的深度信息。
大恒图像的3D成像采用的是激光成像法,其产品不仅包括专门的3D结构光激光器、还有将激光器集成的一体式3D智能传感器Gocator,该产品还继承标定算法,出厂前标定完毕,开箱即可用于测量。
IP与处理器的完美结合
无论是何种嵌入式视觉处理应用,都是典型的计算密集型需求,这使得它比之前的处理器多了很多挑战。
“在过去的几十年里,处理器结构发展了不同阶段来满足不断变化的应用需求。1980年代的是用于台式电脑和和服务器的CPU;1990年代DSP出现以加速音频编解码和无线/有线语音/数据编解码的要求;2000年GPU达到新层面的性能和并行性从而实现2D和3D图像;现在,嵌入式视觉处理需要的是完全不同的处理器架构:ICP。”
上述这段话是分享在CogniVue公司的英文网站上,该公司业务开发副总裁Tom Wilson在采访中指出,“新一代的应用需要100倍以上的嵌入式视觉性能/功耗,为满足这些应用的性能和功率需求,与传统
文档评论(0)