(卷积递归深度学习在3D物体分类上的应用.docVIP

下载本文档

2
0
约9.75千字
约 11页
2017-01-20 发布于北京
举报
版权申诉

(卷积递归深度学习在3D物体分类上的应用.doc

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

(卷积递归深度学习在3D物体分类上的应用

卷积递归深度学习在D物体分类的应用Convolutional-Recursive Deep Learning for 3D Object Classification） Richard Socher, Brody Huval, Bharath Bhat, Christopher D. Manning, Andrew Y. Ng Computer Science Department, Stanford University, Stanford, CA 94305, USA 摘要 3D传感技术的最新进展使人们有可能轻松地拍摄彩色和深度信息并存的图片，的的集的模型在标准了的艺术表现力，与其他可比的架构相比（两层CNN）训练和测试的阶段更准确、快捷得到结果。简介实用化家庭环境下的机器人十分重要已经结合标准视觉系统在家用机器人中运用了变化的，集本文介绍了用于对象识别的第一卷积递归深度学习模型，该模型速度、性地家用物品特点上可以找到模型采用原始的RGB和深度图像进行分析从中提取特征网络层特征边缘）上的允许滤波器相应随后给权重RNN分层地投入到低维空间中。本文也，i）为每组输入使用了不同的树型结构，（ii）采用具有一组权重的iii）限制树状结构为二叉树利用固定树结构、输入BNN和N叉树的方法四个方面基于RNN结构可能由此，CNN层中固定的树结构不会降低性能，且提高了识别速度随着特征的增加，RNN模型的性能也随之提高。分层组成的RNN特征连接，的输入图1：模型概述：一个从RGB和深度图像信息中提取特征的单一CNN层输入特征最重要的是，经证实的用于的权重，得到了一个既能快速训练又能测试高度并行的D物体分类系统。卷积得到了得到卷积递归神经网络本节描述了新建立的，随机曲面的聚类CNN过滤器进行无监督学习然后这些曲面转化成CNN层给高阶的可被用于图像分类。在卷积中要使用的过滤器。首先模式（和深度）随机曲面两个集合中对每组曲面规范化和白化。的曲面用简单k-means进行聚类操作了两方法得到的过滤器他们捕获了标准边缘和颜色特征深度通道应用的一个结果是物体边界这是物体边界和背景较大的不连续性有很多噪声但是图2：非监督预训练后层中-means过滤器的可视化：显示效果最好物体边界强烈的不连续性，的灰度训练得到的过滤器）相比，的结果是类似的尽管边缘锐化程度较小。CNN结构具有，CNN生成RNN层的特征。 CNN的主要思想是，将输入图像过滤使用的单层CNN与Jarrett提出的类似，矫正和对比度标准化（）一个卷积。LCN设计灵感来自于计算，用于一个特征映射内对比特征以及相同空间位置的跨特征映射每个图像的大小和）K方形过滤器的大小dp进行卷积每个大小为-dp+1，得到K滤波器的响应。用方形区域大小dl大小s均值，得到一个宽和高都等于-dl)/s+1的响应。因此一幅图像通过CNN层得到的输出X是一个K×r×r的三维矩阵颜色和深度图像信息中进行以上步骤。一个树状结构中地相同的神经网络，分层特征表示形式中，的叶节点是K维向量（图像切片的CNN汇集结果在所有K过滤器上重复），一共有。，这样做有更大的灵活性，但是对于层的物体分类任务获得高性能是不的最优树上的搜索降低了方法的速度并行搜索化大矩阵产品实现后者多核硬件（GPU）获益匪浅。在工作中，重点在于设计出平衡的固定树结构。的工作了向量将RNN结构向量对推广到允许各层由每个图像的D矩阵X∈RK×r×r开始是K维的）一个全为相邻列向量的块合并为一个父向量p∈RK方便起见，下文只使用方形块块的大小K×b×b。例如如果以b=3一个向量组为一个，最终得到大小为块和一张向量组结果列表（…,x9）情况下，在每个块中有2个向量，网络中计算父向量的公式是），参数W∈RK×b2K，f是的（tanh）由于偏置对下面的实验没有影响，省去这个术语。式相同权重W，于X中所有向量的块一般而言（）p组成一个新的矩阵P1在矩阵X中运用公式，P1的向量以同样固定的权重合并成块，形成矩阵P2以上步骤直到只剩一个父向量位置。图一个输出CNN有子块的RNN结构的例子图3：块中相同的神经网络计算一组子向量的父向量。原始矩阵是卷积合并的输出。为止，模型是非监督的。，的任务是将每个块分类许多类别。选取顶层向量Ptop作为softmax分类的特征向量。了尽量减小softmax的交叉熵误差，通过递归神经网络和卷积层传播。证明，该操作速度较慢，将在本文下中讨论其他方法。实际上可以矩阵X作为一组RNN的输入，每N个RNN输出一个K维向量所有RNN向前传播，所有输出串联成N个K维向量，随后传递给softmax分类器。 RNN中W的通过结构反向传播，发现，随机权重的RNN高质量的特征向量组的结果在权重密切相关的C