- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器视觉第十六章
第十六章 物体识别 16.1 识别系统的基本组成 16.2 物体识别的复杂度 16.3 图象矩不变量特征表示 16.4 三维物体模型表示 16.5 特征检测与识别策略 16.6 验证 16.7 物体定位 16.1 识别系统的基本组成 可以认为,物体识别系统包括四个主要模块:即模型库、特征检测器、假设生成(hypothesis formation)和假设验证(hypothesis verification)等模块。图16.1给出了系统不同模块之间的作用和信息流图。 16.2物体识别的复杂度 物体识别的复杂度依赖于以下几个因素: 场景的不变性 场景的复杂度取决于获取图像时的条件(照明、背景、摄像机参数和观察点 )是否同模型建立条件相似。如前几章所置述,场景的条件显著地影响同一物体的图像。在不同的场景条件下,不同特征检测器的性能显著不同。因此必须考虑背景、其它物体以及照明的特性,以决定哪种特征可以得到有效而可靠地检测。 图像模型空间 在某些应用中,三维物体可以近似地认为是二维物体,此时的物体模型可以用二维特征来表示。如果模型是三维且不能忽略透视效应,那样情况就变得很复杂。在这种情况下,特征是在二维图像空间中检测的,而物体的模型可能是在三维空间中表示的。这样,同一个三维空间特征可能在三维图像中表现为不同的特征。在动态图像分析中,由于物体运动,这种情况也会发生。 模型库中物体的数目 如果物体的数目很少,则可以直接使用顺序穷举匹配方法,无需假设生成阶段。如果物体的数目很大,则假设生成阶段是很重要的。用于物体识别的特征选择计算量也随着物体数量的增加而迅速地增加。 图像中物体的数目和遮挡问题 如果图像中只有一个物体,它可能是完全可见的。随着图像中物体的数目增加,遮挡概率也随之增加。在许多图像分析中,遮挡是一个严重的问题。遮挡导致了原先特征点的消失,新特征点的产生。因此,在假设验证阶段就应该考虑遮挡问题。一般来说,识别任务的难度随着图像中物体数目的增加而增大。图像中遮挡物体的存在也使图像分割难度增大。 16.4 三维物体模型表示 在工程研究领域,人们常常通过牺牲某一部分的代价来换取另一部分的高性能。在机器视觉领域,为了提高某一算法的有效性,通常是以增加运算量或增加计算成本(时间、存贮空间或硬件成本)为代价的。用于物体识别的表示也不例外。因此,设计者必须认真考虑系统设计问题中的参数,一般选择最好的表示。目前,人们已经开发出许多物体表示方法。 这些方法大致分为三大类: 基于表面的物体模型表示方法,如表面片、网机表示等。 基于体积的物体表示方法,如结构立体几何、体元或体系表示。 基于函数的表示方法,样条函数、超二次曲面等到。 16.4.1 多视图表示 如果要通过图像识别三维物体,则三维物体必须由若干幅图像来表示,这些图像是从空间中任意点或从特定点拍摄的。对于大多数物体来说,必须获取表示该物体各个方向的形态的大量图像才能实现有效的物体识别任务。 用图像表示物体的一种方法是朝向图(aspect graph)表示,朝向图包含了一个物体的所有稳定的视图。以及所有稳定视图之间的关系。图16.2给出了一个简单的物体及其朝向图,朝向图的每一个结点表示一个稳定的视图,结点连线表示从一个稳定视图到另一个稳定视图的过程。 16.4.2 结构立体几何 结构立体几何(constructive solid geometry, CGS)方法使用简单的立体基元和一组布尔运算来表示物体,立体基元包括长方体、圆锥、圆柱和球等简单的三维形状,布尔运算是指:并、交、差。CGS表示式如下: CGS 表示::立体基元 | 依据 运动参数 移动 CGS表示 | CGS 表示 布尔运算 CGS 表示 利用上述运算可以将物体的结构立体几何表示用一个树结构来描述,如图16.3所示。叶结点表示立体基元或运动参数,其它结点表示布尔运算。通过立体基元可以构造许多“人工”物体,如图16.4所示。 实际上,一般曲面的物体都不能用所选的几种基元来表示,所以CSG在物体识别中的应用十分有限。这些表示常用于CAD/CAM应用中的物体表示。 16.4.3 体积表示 三维物体可以用该物体所占三维空间的非重叠子区域来表示,即空间占有量。一般非重叠子区域可以分为标准和非标准两大类。标准子区域是指正方体、长方体等基本体素(voxel),利用这种
文档评论(0)