网站大量收购独家精品文档,联系QQ:2885784924

计算机视觉技术实战 课件 项目2 图像分类:基于ResNet-18的时尚商品识别.pptx

计算机视觉技术实战 课件 项目2 图像分类:基于ResNet-18的时尚商品识别.pptx

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

项目2图像分类:基于ResNet-18的时尚商品识别

教学目标能力目标(1)掌握Pytorch内置数据集的加载和预处理。(2)理解ResNet-18的基本结构和工作原理。(3)掌握Pytorch预训练模型的选择和微调方法。(4)掌握TensorBoard可视化工具的安装和使用。(5)熟悉使用ResNet-18预训练模型进行图像分类。知识目标(1)掌握解决图像分类任务的基本步骤和实际操作技能。(2)为进一步深入学习更复杂的视觉任务打下坚实的基础。

工程目录图2-1是项目的主要文件和目录结构。其中dataset为存放数据集的目录,model为存放模型文件的目录,logs为存放TensorBoard日志文件的目录。ResNet18.ipynb和ResNet18.py为本项目的主要代码文件,两者内容一致,前者用于jupyter交互执行,更加直观;后者用于脚本执行,更加高效。?+--Project2_ImageClassification/|+--dataset/||+--FashionMNIST/|+--logs/|+--model/||--model_val81.3.pth||--model_val90.05.pth|--RestNet18.ipynb|--RestNet18.py?图2-1项目的主要文件和目录结构

目录2TensorBoard的安装与使用1认识数据集Fashion-MNIST和预训练模型ResNet-183模型训练与评估

目录2TensorBoard的安装与使用3模型训练与评估1认识数据集Fashion-MNIST和预训练模型ResNet-18

1.认识数据集Fashion-MNIST和预训练模型ResNet-18任务目标(1)了解Fashion-MNIST数据集的来源、收集方式和组成结构。(2)了解ResNet-18的网络结构及特点。

1.1Fashion-MNIST数据集介绍Fashion-MNIST数据集是由Zalando(一家德国的时尚科技公司)旗下的研究部门提供。其涵盖了来自10种类别的共7万个不同商品的正面图像,每个类别有7,000张图像,每张图像的分辨率为28x28像素。目前Fashion-MNIST已经内置到各个深度学习框架中,包括Pytorch。原始数据集按60000/10000的训练测试数据划分,同时每个训练和测试样本都按照表2-1的类别进行了标注。表2-1标注编号的含义标注编号描述0T-shirt/top(T恤)1Trouser(裤子)2Pullover(套衫)3Dress(裙子)4Coat(外套)5Sandal(凉鞋)6Shirt(汗衫)7Sneaker(运动鞋)8Bag(包)9Ankleboot(踝靴)数据集来源

1.1Fashion-MNIST数据集介绍数据集展示图2-2数据集样例展示

1.2ResNet-18算法简介ResNet-18(ResidualNetwork-18)是深度卷积神经网络(CNN)的一种架构,它是ResNet系列中的一员,由微软亚洲研究院的研究人员KaimingHe等四名华人于2015年提出。ResNet的设计基于残差学习(ResidualLearning)的思想,这一思想的提出在深度学习领域具有重大影响。ResNet的核心思想是通过引入残差块(ResidualBlocks)和批归一化(BatchNormalization)来解决深度神经网络训练时的梯度消失或爆炸和退化问题(degradationproblem)。传统的深度神经网络由于层数较深,在反向传播时,梯度可能变得非常小,导致网络难以训练。ResNet通过在网络中引入跳跃连接(SkipConnections)来允许信息在不同层之间直接传递,从而减轻了这一问题。残差块结构如图2-3所示。在残差块中,输入x通过两个或多个卷积层后,与原始输入相加,然后通过激活函数relu进行输出。这种直接的跨层连接允许梯度在网络中更容易地传播,减轻了梯度消失或爆炸问题,从而使得深层网络更容易训练。图2-3残差块结构示意图

1.2ResNet-18算法简介ResNet-18的主要特点包括:(1)深度。ResNet-18包括18个层(指的是带有权重的18层,包括卷积层和全连接层,不包括池化层和BN层),因此属于相对较深的网络。这使得它在提取高级特征和模型的表达能力方面非常强大。(2)残差块。网络中的基本构建块是残差块,每个残差块包括两个卷积层,每个卷积层后面跟着一个批量归一化层(BatchNormalizationLayer)和ReLU激活函数。跳跃连接将输入直接加到这些层的输出上,然后通过另一个ReLU激活函数。这样

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档