PyTorch与深度学习实战-全套PPT课件.pptx

下载文档

6
0
约6.82万字
约 469页
2023-11-18 发布于上海
举报
版权申诉
保障服务

PyTorch与深度学习实战-全套PPT课件.pptx

1、本文档共469页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

深度学习简介;;深度学习目前在很多领域的表现都优于过去的方法，在图像分类与识别、语音识别与合成、人脸识别、视频分类与行为识别等领域都有着不俗的表现。除此以外，深度学习还涉及到与生活相关的纹理识别、行人检测、场景标记、门牌识别等领域。人脸识别采用深度学习方法后的识别率超过了目前非深度学习算法以及人类的识别率，深度学习技术在语音识别领域更是取得了突破性的进展，在大规模图像分类问题上也远超传统方法。 ;深度学习（Deep Learning，DL）是机器学习（Machine Learning，ML）领域中一个新的研究方向，深度学习被引入机器学习使其更接近于最初的目标——人工智能（Artificial Intelligence，AI）。深度学习的目标是学习样本数据的内在规律和表示层次。在2015年第9期《自然》杂志中，存在与深度学习定义相关的内容：深度学习方法是具有多层次特征描述的特征学习，通过一些简单但非线性的模块将每一层特征描述（从未加工的数据开始）转化为更高一层的、更为抽象一些的特征描述。 ;深度学习的关键在于这些层次的特征不是由人工设计的，而是使用一种通用的学习步骤从数据中学习获取的。这些学习过程中获得的信息对文字、图像和声音等数据的解释有很大的帮助。深度学习在搜索技术、数据挖掘、机器翻译、多媒体学习、语音识别、推荐和个性化技术以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动，解决了很多复杂的模式识别难题，使得人工智能相关技术取得了很大进步，最终目标是让机器能够像人一样具有分析学习能力。 ;20世纪80、90年代，由于计算机计算能力有限和相关技术的限制，可用于分析的数据量太小，深度学习在模式分析中并没有表现出优异的识别性能。在2002年，杰弗里·辛顿（Geoffrey Hinton）等提出受限玻耳兹曼机（Restricted Boltzmann Machines，RBM）的一个快速学习算法，即对比散度算法（Contrastive Divergence，CD-K）以后，启发了被广泛使用的深度信念网络（Deep Belief Nets，DBN）等深度网络的出现。与此同时，能自动从数据中提取特征的稀疏编码技术也被应用于深度学习中。近年来，随??深度学习技术在图像领域上的应用，能够提取局部区域特征的卷积神经网络方法被大量研究。 ;;深度学习的常见应用有图像分类、图像分割、图像生成、图像标题的生成、图像风格变换、目标检测、物体测量、物体分拣、视觉定位、情感分析、无人驾驶、机器翻译、文本到语音转换、手写文字转录和音频生成。;图像分类的核心是从给定的分类集合中，给图像分配一个标签的任务。实际上，图像分类是分析一个输入图像并返回一个将图像分类的标签。标签总是来自预定义的可能类别集。利用深度学习算法可以实现对猫的图像进行分类，如下图所示。;图像分割就是将图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程，它是由图像处理到图像分析的关键步骤。从数学角度来看，图像分割是将数字图像划分成互不相交的区域的过程。图像分割的过程也是一个标记过程，即把属于同一区域的像素赋予相同的编号。;对街道车辆图像进行分割的结果，如下图所示。;有一种新的研究，能实现在生成图像的过程中不需要另外输入任何图像，只要前期使用大量的真实图像让网络进行学习，即可由网络自动生成新的图像。目前常见的生成模型有VAE系列、GAN系列等。其中GAN系列算法近年来取得了巨大的进展，最新GAN模型产生的图片效果达到了肉眼难辨真伪的程度。;GAN模型生成的假动漫人物图像如下图所示。;神经图像标题（Neural Image Caption，NIC）模型会自动生成介绍输入图像的文字。该模型由深层的卷积神经网络和自然语言语言处理的循环神经网络（Recurrent Neural Network，RNN）构成。卷积神经网络提取图像特征，RNN生成文本。;输入的原图像如下图所示，可以生成诸如“一群人正在骑马”或“一群人正在草原上骑马”或“一群人正在蓝天白云下的草原上享受骑马”等标题。;图像风格的变换是利用了卷积神经网络可以提取高层特征的效果，不在像素级别进行损失函数的计算，而是将原图像和生成图像都输入至一个已经训练好的神经网络里，在得到的某种特征表示上计算欧式距离（内容损失函数）。这样得到的图像与原图内容相似，但像素级别不一定相似，且所得图像更具鲁棒性。输入两个图像，计算机会生成一个新的图像。;两个输入图像中，一个称为“内容图像”，如图1-5所示；另外一个称为“风格图像”，如图1-6所示。如果将梵高的绘画风格应用于内容图像上，那么深度学习会按照要求绘制出新风格，其输出图像如图1-7所示。;目标检测就是从图像中确定物体的位置，并对物