- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
教学案例9:图像分类
一、实验目的与任务
使学生掌握图像特征提取、传统图像分类、神经网络图像分类方法,了解MNIST、
CIFAR等图像数据集的构成。
二、实验内容、要求及安排
实验内容:以手写数字分类、人脸识别为任务,实现基于传统分类器,以及基于神经
网络的图像分类算法。实验中应注意针对手写数字分类与人脸识别两个不同任务,传统分
类器与神经网络模型对实验结果、实验参数、算法时间和空间复杂度的区别。实验报告中
要包含问题的数学原理描述、算法描述、实现,实验结果展示及分析。
实验要求:本课程实验要求学生使用Python语言编程。要求学生依据课堂讲授的相关
知识,经过分析、设计、编码与调试,独立完成手写数字分类和自然图像识别算法设计与
程序实现,并最终提交调试成功的源程序代码和实验报告。
实验安排:本实验属于开放性实验,要求每个学生独立地完成本实验项目。
三、任务实现及相关素材
(一)任务简介:图像分类是指将输入的图像分为不同的预定义类别的任务。它通过
学习一组训练图像和对应的标签,来建立分类模型。常见的图像分类方法包括传统的特征
提取和机器学习算法,以及基于深度学习的神经网络模型。图像分类在图像搜索、广告推
荐、智能客服等场景中被广泛应用。
(二)数据集简介:
1.MNIST(ModifiedNationalInstituteofStandardsandTechnology)数据集是由美国国
家标准与技术研究院修改的手写数字数据集,是深度学习和机器学习领域中最常用的数据
集之一。MNIST数据集由一系列28×28像素大小的灰度图像组成,每个图像表示了0~9
十个数字中的一个。每张图像都有一个对应的标签,表示图像所代表的数字。数据集分为
训练集和测试集,其中训练集包含了60000张图片,测试集包含了10000张图片。
2.CIFAR-100(CanadianInstituteforAdvancedResearch-100classes)是一个经典的图
像分类数据集,用于计算机视觉领域的研究和算法测试。它是CIFAR-10数据集的扩展版
本,包含了更多的类别,用于更具挑战性的任务。CIFAR-100包含100个不同的类别,每
个类别都包含600张32x32像素的彩色图像;这100个类别被划分为20个大类别,每个
大类别包含5个小类别。这个层次结构使得数据集更加丰富,包含了各种各样的对象和场
景。每张图像的大小是32x32像素,包含RGB三个通道。
3.ImageNet是一个庞大的视觉对象识别数据库,由斯坦福大学的计算机科学系开发。
它是一个包含超过1400万张图像的大规模图像数据库,用于训练和评估计算机视觉算法。
ImageNet数据集的目标是识别和分类图像中的各种物体和场景。它涵盖了从动物到交通工
具等各个领域的图像。
上述数据集可以从网上搜索下载。
(三)模型简介:
1.VGGNet是在2014年由KarenSimonyan和AndrewZisserman提出的,VGG与
AlexNet相比,它是将AlexNet模型中较大的卷积核(例如:11x11、7x7、5x5)换成连续
几个3x3的卷积核。其目的是:减少网络参数量;由于参数量被大幅减小,于是可以用多
个感受野小的卷积层替换掉之前一个感受野大的卷积层,从而增加网络的非线性表达能力。
2.Transformer模型最开始是用于自然语言处理(NLP)领域的,NLP主要处理的是文本、
句子、段落等,即序列数据。为了将Transformer模型应用到图像数据,需要把图像数据转
换成序列数据,并对整个图片进行patch分割,然后通过线性投影对图片特征进行提取,
加上class标签及位置编码,最后输入TransformerEncoder中进行计算。
(四)环境说明:
算法开发环境推荐使用anoconda+pytorch,编程语言为Python。
Anaconda是一个用于科学计算的Python发行版,Anaconda支持Linux,Mac,Windows
系统,提供了包管理与环境管理的功能,可以很方便地解决多版本python并存、切换以及
各种第三方包安装问题
文档评论(0)