人民大2024《人工智能与Python程序设计》课件(教材配套版)第13章-计算机视觉实践-2卷积神经网络介绍.pdf

人民大2024《人工智能与Python程序设计》课件(教材配套版)第13章-计算机视觉实践-2卷积神经网络介绍.pdf

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主要内容包括单个卷积层池化层和卷积神经网络,分别用于手写数字识别和分类问题单个卷积层采用3×32×32的RGB图片中的某个数字作为输入,并计算该数字对应的批处理结果卷积层后的输出结果是6×28×28,然后通过前向传播进行最终的特征转换摘要概述了上述内容的主要信息,并且主要讨论了卷积神经网络如何应用于手写数字识别以及分类问题它还提供了简单易懂的Python版本的卷积神经网络实现总的来说,这是关于如何将给定的数据集转化为深度学习模型的一个基本指南

《人工智能与Python程序设计》——卷积神经网络

人工智能与Python程序设计教研组

提纲

单个卷积层

池化层

卷积神经网络

卷积神经网络

手写数字识别

•3×32×32的RGB图片中含有某个数字,识别它是从0-9这10个数字中

的哪一个

•分类问题

卷积神经网络

•类似LeNet-5(YannLeCun创建)

卷积神经网络

•输入是3×32×32的矩阵,第一层使用滤波器大小为5×5,步幅是1,

padding是0,滤波器个数为6,那么输出为6×28×28。将这层标记

为CONV1,增加偏差,应用非线性函数(如ReLU)后输出结果。

单个卷积层

•输入图片大小是3×32×32

•用3×5×5的卷积核

•输出:(32+0-5)/1+1

单个卷积层

•单个卷积核得到特征图

单个卷积层

•每个卷积核得到一个特征图

单个卷积层

•总共有6个卷积核

单个卷积层

•前向传播(在每个局部):

•非线性函数:

•滤波器用变量表示。

•每个局部共进行了多少次乘法运算和加法运算?

•应用激活函数ReLU,得到的6×28×28矩阵成为神经网络的下一层的

输入。

•通过这个过程把一个3×32×32维度的输入图像变换为一个6×28×28

维度的特征图,这就是卷积神经网络的一层

Pytorch卷积层

•Pytorch实现这些只需要一行代码

•nn.Conv2d(self,in_channels,out_channels,kernel_size,stride=1,

padding=0,dilation=1,groups=1,bias=True))

–in_channel:输入数据的通道数;

–out_channel:输出数据的通道数;

–kennel_size:卷积核大小,可以是int,或tuple;

–stride:步长;

–padding

/docs/stable/generated/torch.nn.Conv2d.ht

ml?highlight=conv2d#torch.nn.Conv2d

Pytorch卷积层

提纲

单个卷积层

池化层

卷积神经网络

卷积神经网络

卷积神经网络

•在第一个卷积层之后,构建一个池化层,这里选最大池化,过滤器为

2×2,步幅为2,padding为0。最终输出为6×14

您可能关注的文档

文档评论(0)

allen734901 + 关注
实名认证
内容提供者

知识共享

1亿VIP精品文档

相关文档