浅谈深度学习的技术原理与其在计算机视觉的应用.docx

下载文档 降价啦

4
0
约4.57千字
约 11页
2018-06-16 发布于福建
举报
版权申诉
保障服务

浅谈深度学习的技术原理与其在计算机视觉的应用.docx

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

UCLoud中国云三强: 浅谈深度学习的技术原理及其在计算机视觉的应用目前，深度学习几乎成了计算机视觉领域的标配，也是当下人工智能领域非常热门的研究方向。计算机视觉的应用场景和深度学习背后的技术原理是什么呢？下面让我们来一探究竟。计算机视觉的应用什么是计算机视觉呢？形象地说，计算机视觉就是给计算机装上眼睛（照相机）和大脑（算法），让计算机可以感知周围的环境。目前计算机视觉研究主要集中在基础应用场景，像图片分类、物体识别、人脸的3D建模等。识别物体是图片分类的一个比较常见的应用，例如一个简单的猫咪识别模型，我们首先要给计算机定义模型，然后准备大量猫咪的照片去训练这个模型，让计算机能识别出来，输一张图片的时候能识别出图片是不是猫咪。正常情况下计算机模型能识别得比较准确，但是当我们输入了一些有遮挡、形态多变或者角度、光照不一的图片时，之前我们建立的模型就识别不出来。这就是计算机视觉在应用中存在的难点问题。深度学习背后的技术原理机器学习在计算机视觉领域中是怎么运用深度学习来解决问题的呢？深度学习作为机器学习的一种，这里先简单介绍下机器学习。机器学习的本质其实是为了找到一个函数，让这个函数在不同的领域会发挥不同的作用。像语音识别领域，这个函数会把一段语音识别成一段文字；图像识别的领域，这个函数会把一个图像映射到一个分类；下围棋的时候根据棋局和规则进行博弈；对话，是根据当前的对话生成下一段对话。机器学习离不开学习两个字，根据不同的学习方式，可以分为监督学习和非监督学习两种方式。监督学习中，算法和数据是模型的核心所在。在监督学习中非常关键的一点是，我们对训练的每个数据都要打上标签，然后通过把这些训练数据输入到算法模型经过反复训练以后，每经过一次训练都会减少算法模型的预计输出和标签数据的差距。通过大量的训练，算法模型基本上稳定下来以后，我们就可以把这个模型在测试数据集上验证模型的准确性。这就是整个监督学习的过程，监督学习目前在图片??类上应用得比较多。再来看非监督学习。跟监督学习不同的地方是，非监督学习不需要为所有的训练数据都打上标签。非监督学习主要应用在两个大类，一类是做聚类分析，聚类分析是把一组看似无序的数据进行分类分组，以达到能够更加更好理解的目的；另外是做自动编码器，在数据分析的时候，原始数据量往往比较大，除了包含一些冗余的数据，还会包含一些对分析结果不重要的数据。自动编码器主要是对原始数据做降维操作，把冗余的数据去掉，提高后面数据分析的效率。通过不同的学习方式获取到数据后，算法是接下来非常重要的一环。算法之于计算机就像大脑对于我们人类，选择一个好的算法也是特别重要的。上面是ImaegNet竞赛的结果，2012年以前图片分类采用的机器学习的模型是特征+支持向量机的模型，2012年以后是卷积神经网络的模型，卷积神经网络在计算机视觉领域发挥着至关重要的作用。为什么2014年以后卷积神经网络才发挥它的作用呢？我们先来看看神经网络。神经网络神经网络是受人脑神经元结构的启发，研究者认为人脑所有的神经元都是分层的，可以通过不同的层次学习不一样的特征，由简单到复杂地模拟出各种特征。上图是计算机应用数学的方式来模拟人脑中神经元的示意图。a1到ak是信号的输入，神经元会对输入信号进行两次变换。首要部分是线性变换，因为神经元会对自己感兴趣的信号加一个权重；其次部分是非线性变换。神经网络就是由许多的神经元级联而形成的，每一个神经元都经过线性变换和非线性变换，为什么会有非线性变换？从数学上看，没有非线性变换，不管你神经网络层次有多深都等价于一个神经元。如果没有非线性变换，神经网络深度的概念就没有什么意义了。这是大家知道的神经元网络整体的模型，我们具体怎么来训练神经网络呢？步骤一，定义一个网络模型，初始化所有神经网络的权重和偏置。定义好网络模型以后再定义好这个模型的代价函数，代价函数就是我们的预测数据和标签数据的差距，这个差距越小，说明模型训练得越成功。开始训练的时候会初始化所有神经元的参数。输入所有训练数据以后，通过当前的模型计算出所有的预测值，计算预测值以后和标签数据比较，看一下预测值和实际值有多大的差距。步骤二，不断优化差距，使差距越来越小。神经网络根据导数的原理发明了反向传播和梯度下降算法，通过N次训练后，标签数据与预测值之间的差距就会越来越小，直到趋于一个极致。这样的话，所有神经元的权重、偏置这些参数都训练完成了，我们的模型就确定下来了。接下来就可以在测试集上用测试数据来验证模型的准确率。卷积神经网络以上所讲的都是一般的全连接神经网络，接下来进入卷积神经网络。卷积神经网络是专门针对图片处理方面的神经