混乱场景中物体的三维识别与分割.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
混乱场景中物体的三维识别与分割 摘要:在这篇文章中我们提出了不同于深度图像分割和识别的新方法。我们产生脱机的三维模型库,并用张量集表示法来表示每个模型。用张量表示模型局部面片的同时,用4D的哈希表建立张量的索引。在联机阶段,从深度图像随即选取一个种子点,并用一个张量来表示它的相邻表面。利用选举计划(voting scheme)把这个张量与模型库的张量相匹配。接受选票最多的模型被呈现在场景中。然后将该模型转化成相应的深度图像。If the model aligns accurately with a portion of the range image,深度图像的该部分将被识别,分割和删除。从剩余部分的深度图像来选取另一个种子点,直到整个场景都被分割或者是在场景中所有的物体库都被识别停止匹配。我们的实验将说明这种算法的有效性,以及在混乱场景中的和在occluded深度图像中所得到的准确结果。 1 简介 深度图像分割的目的在于准确的识别三维物体的边界或者是有兴趣的部分,并将他们从数据集中分割出来。然而,分割问题存在一种病态,它的现存定义不能保证图像分割的唯一性。深度图像分割的主要应用包括物体识别和分类。例如,混乱场景中利用深度图像的三维分割来进行物体识别。在我们的方法中也采用了这个范例,我们使得深度图像的分割及自由形态(free-form)物体的识别同时进行。三维物体识别和深度图像分割的主要困难(挑战)是由于遮挡(occlusions)(包括自身遮挡和由其它物体引起的遮挡)和杂乱(clutter)(由于噪声和多余的物体)的存在,而这些困难经常出现在现实场景中。 下面是对一些现有的分割技术的主要回顾。基于分割技术的Deformable models计算量大而且需要人工交互确定数据库中起始模型的位置。这些技术还需要人工的选择初始参数。此外,Deformable models仅能用于二维和三维volumetric深度图像的分割,而不能进行深度图像的分割。地图集分割技术例如[7][24]也只能用在三维volumetric深度图像的分割。Pulli和Pietikainen的深度图像分割算法只限于平面和光滑曲面物体。由于很难从被检测边的映射(maps)中提取重要的区域,使得基于分割技术的三维边缘检测很难实现。另外,这些算法不适用在区域间低深度变化的情况。(these algorithms do not perform well in case of low depth variations between regions)。基于分割技术的LEGION(Locally Excitory Globally Inhibitory Oscillator Networks)计算量大。基于分割技术的数学形态学是非自动的而且需要使用者定义控制侵蚀和膨胀(the erosion and dilation)操作的标准。区域增长分割算法对种子点和occlusions的选取比较敏感。对于相同的深度图像,选取不同的种子点可能得到不同的分割结果,另外,遮挡问题能够引起分割区域中包含false holes。绝大多数这些技术都没有在具有自由形态物体的场景中测试过。而且,这些算法只能执行分割,而不适用于物体识别。 对于三维物体识别的现有工作,Dorai’s COSMOS表示法不能应用在occluded场景中,并且在计算主曲率(principle curvatures)的时候容易受到噪声的影响。Stein’s structural indexing算法不适用于自由形态的物体。SAI 匹配只适用于拓扑结构相当于球的物体。B-样条曲线匹配技术受到节点问题的限制。比如,给定B-样条曲线的节点的位置不唯一。基于识别的HOT 曲线对于噪声没有鲁棒性。另外,所有的算法都假设场景中单个物体存在,并且没有在杂乱场景中测试。Johnson的识别算法在杂乱和遮挡场景中得到很好的效果,但是这种算法要求模型库和场景分辨率是一致的。大多数这些算法采用都是一对一(one to one)的匹配策略,在这种情况下识别时间正比于模型库的大小。 本篇文章介绍一种基于分割的自动的三维识别算法,该算法可适用在包含杂乱和遮挡的复杂深度图像中。这种算法是完全自动的,不需要任何人工的干涉。这个算法简要概括如下,在脱机阶段,利用张量表示法建立物体的三维模型库[20],同时采用4D的哈希表建立模型张量的快速索引。在联机阶段,在深度图像中随机选取得一点,并在该点上生成种子张量。利用种子张量沿着哈希表在模型库中投票来匹配张量。接受选票最多的模型被转换成相应的深度图像。如果模型可以用深度图像的一部分准确的排列(不太理解是什么意思),该部分就被识别并分割。分割的部分被删除掉,再剩下的深度图像中重复这种分割和识别。 2 模型库的建立

文档评论(0)

yuxiufeng + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档