郑州大学-机器学习深度学习概论.pdfVIP

下载本文档

0
0
约1.31万字
约 53页
2024-05-10 发布于湖南
举报
版权申诉

郑州大学-机器学习深度学习概论.pdf

1、本文档共53页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

深度学习概论

汇报人：李文哲、李可欣

1自动编码器的架构

2降噪自动编码器

Contents

3稀疏自动编码器

4变分自动编码器

1.自动编码器的架构（Autoencoders）

自动编码器（Autoencoders）是深度学习领域经典的无监督网络

之一，因其作为生成模型的种种表现而闻名，其诞生的最初目的是

为了实现各种目的下的“数据表示”。

数据表示（DataRepresentation）是使用另一种形式呈现原始数据

的方法，这一技术也被称为隐式表示（latentRepresentation）或者转

码（coding）。举例说明：

在上边水果的例子中，对于序列[0,1,2]来说，我只能知到水果有三个

类别，但并不能具体地知到是哪几种水果；同样的，用水果去表示的

话，我也不能具体地知到是哪些水果。

但是在第一个例子中，我用[x,2x,3x,4x,5x]且x=2就可以非常精确地

表达出原始数据。

很显然，一个数据的数据表示是不唯一的，且这种表示可以是精确的、

也可以是有些模糊的，甚至可以看起来与原始数据毫不相关，但无论如何，

数据表示的结果必须携带原始数据上的大部分信息。

广义地来说，只要数据B是以另一种形式呈现数据A，并且数据B上携带数据A

大部分信息，我们就可以说B是A的数据表示。同时，另一种形式既可以是文

字-数字这样不同类别的数据之间的形式差异，也可以是数字-数字这样相同类别

、但不同大小、不同数量的数据之间的形式差异。（如对于一组数据，60分以上

记为1，60分以下记为0）

在实际计算当中，当数据B是数据A的数据表示时，数据B常常是从数据A中总

结出的规律、或直接在数据A上计算得出的新数据。

从中我们不难发现，根据数据表示的广义定义，我们熟悉的特征提取、升维

降维等方法都可以被囊括到数据表示的领域当中（因为这些手段都属于我使用

另外一种形态的数据来表示原始数据的信息）。

在机器学习或者深度学习中令算法自己求解出数据表示结果的领域被称为表征

学习（RepresentationLearning）。而要介绍的自动编码器正是表征学习领域

极具特色的代表模型，因此自动编码器常被用于降维，特征提取这些将原始数据

转换、提炼为另外的表现形式的领域。为了实现数据表示的功能，自动编码器能

够接收数据A，并输出另外一种形式的数据B，因此自动编码器是为生产数据而

生的。

在这样一种前提下，自动编码器的架构如下：

一般在其他的类型的神经网络里面，是不会有类似的架构图的。

这些虚线表示刚开始输入的数据的特征一层一层的变少，又一层层的

逐渐变多。实际上，类似于神经网络，每一层的每一个神经元都会与

下一层的所有神经元进行相连。

在图片中，编码器是用于提取特征的；而解码器是用于生成数据

或图片的。

那么自动编码器与普通的神经网络有什么区别呢？

自动编码器的架构图是对称的，呈现出了两边大，中间小的样

子（就像两个矿泉水瓶的瓶口对接在一起）。即两边上的神经

元数量是比较多的，而中间层的神经元数量比较少。这一特点

在整个深度学习中都是不常见的。以后我们见这种结构的网络，

要么是个自动编码器，要么就是由自动编码器改进而来的。

自动编码器的输出层的神经元的数量与输入层的神经元的数量

往往是一致或高度相似的。

而对于普通的有监督的神经网络（如人工神经网络），输

出层上的神经元的数量实际上必须根据我们所需要的标签类别

数量去决定。例如，如果是10分类，最后的输出层就需要有10

个神经元。

对于自动编码器，输出层的数据与输入层的数据在结构上

是一致的。这样我们就可以去检查输出层的数据是否携带了输

入层的数据的大量的信息。例如如果是输入的图像，那么输出

的图像的尺寸与输入的图像的尺寸尽量的一致的话，只

您可能关注的文档

文档评论（0）

wuanbds001 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

郑州大学-机器学习深度学习概论.pdfVIP