人工智能与计算机应用（微课版）[PP课件]7.2 图像识别.pptx

下载文档 降价啦

41
0
约4.11千字
约 29页
2023-09-19 发布于山东
举报
版权申诉
保障服务

人工智能与计算机应用（微课版）[PP课件]7.2 图像识别.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

广西民族大学公共计算机教研室课程团队图像识别图像识别：指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对象的技术，是应用深度学习算法的一种实践应用一、基于手工特征的图像分类二、基于深度神经网络的图像分类三、深度神经网络的发展本节内容四、图像识别在日常生活中的应用基于手工特征的图像分类 1．计算机眼中的图像图像是以数字矩阵的形式存储的，一张图片被分成了若干个小格子，这个小格子叫做像素，而格子的行数与列数，统称为分辨率像素颜色分量的明暗程度，数字越大表示这个像素点越亮（值在0，255之间）彩色图像：由整数组成的立方体阵列来表示，这样按立方体排列的数字阵列为三阶张量。三阶张量的长度与宽度即为图像的分辨率，高度为3灰度图像：矩阵是高度为1 的三阶张量，因此只有一个通道分辨率 1．计算机眼中的图像灰度图像用0表示最暗的黑色，255表示最亮的白色，介于0和255之间的整数则表示不同明暗程度的灰色用红（R）、绿（G）、蓝（B）三种基本颜色叠加后的颜色，每种基本颜色用0～255的整数表示颜色分量的明暗程度彩色图像人类：只要看一眼图片，大脑就可以获取这些特征计算机：通过一系列计算，从这些数据中提取特征是一件极其困难的事情区分四类照片的特征2．图像的特征卷积是一种向量和矩阵的数学运算。因为数字图像使用矩阵来表示和存储，所以卷积是数字图像处理的一种基本运算方式。卷积是两个变量在某范围内相乘后求和的结果对于维数为m 的向量a=(a1,a2,…,an)和维数为n 的向量b=(b1,b2,…,bn)，其中n≥m，其卷积a*b 的结果为维数为n-m+1 的一个向量c=(c1,c2,…,cn-m+1)，并且对任意i∈{1,2,…,n-m+1}，有卷积运算，如下所示：3．利用卷积提取图像特征卷积运算在图像处理以及其他许多领域有着广泛的应用以灰度图为例，在计算机中一幅灰度图像被表示为一个整数的矩阵，如果我们用一个形状较小的矩阵和这个图像矩阵做卷积运算，就可以得到一个新的矩阵，这个新的矩阵可以看作是一幅新的图像3．利用卷积提取图像特征卷积运算可以将原图像变换为一幅新图像，比原图像更清楚地表示了某些性质，就可以把它当作原图像的一个特征基于深度神经网络的图像分类 1．从特征设计到特征学习深度神经网络可以自动从图像中学习有效的特征，因此它具有强大的图片分类能力。在计算机视觉的各个领域，深度神经网络学习的特征逐渐替代了手工设计的特征，人工智能也变得更加“智能”另一方面，深度神经网络的出现也降低了人工智能系统的复杂度。我们只需要将一张图片输入给神经网络，就可以直接得出对图片类别的预测，不再需要分步完成特征提取与分类2012年的ImageNet 挑战赛来自多伦多大学的参赛团队首次使用深度学习，将图片分类的错误率一举降低了10 个百分点，正确率达到84.7%，这也使得几乎所有的人工智能研究团队开始关注深度学习。自此以后，ImageNet 挑战赛就是深度神经网络比拼的舞台。2016年，来自微软研究院的团队提出一种新的网络结构，将错误率降低到了4.9%，首次超过了人类的正确率。到了2017年，图片分类的错误率已经可以达到2.3%。深度神经网络已经比较好地解决图片分类的问题。mageNet 挑战赛自2018年起不再举办。深度神经网络（DNN）通常由多个顺序连接的层组成。第一层一般以图像为输入，通过特定的运算从图像中提取特征。接下来每一层以前一层提取出的特征输入，对其进行特定形式的变换，便可以得到更复杂一些的特征。这种层次化的特征提取过程可以累加，赋予神经网络强大的特征提取能力。经过很多层的变换之后，神经网络就可以将原始图像变换为高层次的抽象的特征深度神经网络2．深度神经网络的基本结构深度神经网络一般来说第一层是输入层，最后一层是输出层，而中间的层数都是隐藏层输出层输入层隐藏层DNN内部的神经网络可以分为三类：2．深度神经网络的基本结构卷积神经网络（CNN）是一类包含卷积计算且具有深度结构的前馈神经网络。标准的卷积神经网络是一种特殊的、比较深的，并且包含许多隐藏层的网络模型结构对卷积神经网络的研究始于20 世纪80 至90 年代，时间延迟网络和LeNet-5 是最早出现的卷积神经网络；在二十一世纪后，随着深度学习理论的提出和数值计算设备的改进，卷积神经网络得到了快速发展，并被应用于计算机视觉、自然语言处理等领域。3．卷积神经网络卷积层是深度神经网络在处理图像时十分常用的一种层。当一个深度神经网络以卷积层为主体时，我们也称之为卷积神经网络（1）卷积层图片在经过若干卷积层之后，会将得到的特征图转换为特征向量。如果需要对这个特征向量进行变换，经常用到的便是全连接层（2）全连接层在全连接层中，我们会使用若干维数相同的向量与输入向量做内积