《深度学习及其视觉应用》课件课件.pptVIP

下载本文档

1
0
约5.76千字
约 65页
2025-10-22 发布于江苏
举报
版权申诉

《深度学习及其视觉应用》课件课件.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

【Applicabletolecturetrainingworkreport】《深度学习及其视觉应用》

深度学习及其视觉应用丁贵广，GuiguangDing清华大学软件学院dinggg@tsinghua.edu.cn

深度学习及视觉应用深度学习概述视觉应用

深度学习神经网络是多层函数嵌套形成的模型受到生物神经机制的启发?构建多隐层的模型

深度学习本质：通过构建多隐层的模型和海量训练数据（可为无标签数据），来学习更有用的特征，从而最终提升分类或预测的准确性。“深度模型”是手段，“特征学习”是目的。与浅层学习区别：1）强调了模型结构的深度，通常有5-10多层的隐层节点；2）明确突出了特征学习的重要性，通过逐层特征变换，将样本在原空间的特征表示变换到一个新特征空间，从而使分类或预测更加容易。与人工规则构造特征的方法相比，利用大数据来学习特征，更能够刻画数据的丰富内在信息。

深度学习的里程碑2006年，加拿大多伦多大学教授、机器学习领域的泰斗GeoffreyHinton在《科学》上发表论文提出深度学习主要观点：1）多隐层的人工神经网络具有优异的特征学习能力，学习得到的特征对数据有更本质的刻画，从而有利于可视化或分类；2）深度神经网络在训练上的难度，可以通过“逐层初始化”（layer-wisepre-training）来有效克服，逐层初始化可通过无监督学习实现的。

DeepLearning的效果

CNN卷积神经网络（ConvolutionalNeuralNetworks,CNN）

深度学习的具体模型及方法

深度学习的具体模型及方法卷积波尔兹曼机（ConvolutionalRBM）局部感受权值共享减少参数的方法：每个神经元无需对全局图像做感受，只需感受局部区域（FeatureMap），在高层会将这些感受不同局部的神经元综合起来获得全局信息。每个神经元参数设为相同，即权值共享，也即每个神经元用同一个卷积核去卷积图像。

深度学习的具体模型及方法卷积波尔兹曼机（ConvolutionalRBM）隐层神经元数量的确定神经元数量与输入图像大小、滤波器大小和滤波器的滑动步长有关。例如，输入图像是1000x1000像素，滤波器大小是10x10，假设滤波器间没有重叠，即步长为10，这样隐层的神经元个数就是(1000x1000)/(10x10)=10000个

深度学习的具体模型及方法卷积波尔兹曼机（ConvolutionalRBM）多滤波器情形不同的颜色表示不同种类的滤波器每层隐层神经元的个数按滤波器种类的数量翻倍每层隐层参数个数仅与滤波器大小、滤波器种类的多少有关例如：隐含层的每个神经元都连接10x10像素图像区域，同时有100种卷积核（滤波器）。则参数总个数为：（10x10+1）x100=10100个

深度学习的具体模型及方法卷积波尔兹曼机（ConvolutionalRBM）CNN的关键技术：局部感受野、权值共享、时间或空间子采样CNN的优点：1、避免了显式的特征抽取，而隐式地从训练数据中进行学习；2、同一特征映射面上的神经元权值相同，从而网络可以并行学习，降低了网络的复杂性；3、采用时间或者空间的子采样结构，可以获得某种程度的位移、尺度、形变鲁棒性；3、输入信息和网络拓扑结构能很好的吻合，在语音识别和图像处理方面有着独特优势。

对象识别——CNN5个卷积层和2个全连接层每层卷积核个数96,256,384,384,256

监督学习——卷积神经网络96个低级卷积核

监督学习——卷积神经网络网络庞大，但容易收敛唯一不需要特定初始化参数就可以训练成功比较容易并行化训练，并且可以利用GPU加速在计算机视觉（CV）领域取得成功

深度学习及视觉应用深度学习概述深度视觉应用

Classification?Detection?Segmentation

ImageCaptioningImageGeneratorImageCaptioningImageGenerator

CNNModelConvolutionalNeuralNetworkBasedonCaffeFrameworkBasicModelZFNetVGGNetGoogleNetResNetDenseNetSqueezeNet

Classification

ObjectDetection模型：R-CNN,FastR-CNN,FasterR-CNN,YOLO,SSD等知名框架精度：PASCALVOC上的mAP，从R-CNN的53.3%，FastRCNN的68.4%，FasterR-CNN的75.9%，FasterRCNN结合残差网（Resnet-101），达到83.8%速度：从最初的RCNN模型，处理一张图片要用2秒多，到Fast

您可能关注的文档

文档评论（0）

wendangku + 关注: 实名认证

文档贡献者

1亿VIP精品文档

更多 >

《深度学习及其视觉应用》课件课件.pptVIP