《机器视觉理论与实战》 课件 第二章 机器视觉相关理论 .pptx

《机器视觉理论与实战》 课件 第二章 机器视觉相关理论 .pptx

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第二章机器视觉相关理论;2.1机器视觉系统组成;;;2.1.1图像采集系统;;输出为RGB彩色图像,相同分辨率情况下,彩色相机精度低于单色相机。

2.镜头

工业相机采集图像质量的优劣,除相机本身硬件和环境等因素外,还受镜头与光源搭配的影响,它们也是图像采集系统中的关键组件之一。镜头的功能是将光束进行可控的调制,使拍摄目标呈现在传感器的感光面上,所以镜头的选型至关重要,一般需要考虑焦距、分辨率、光圈、像面尺寸、接口等。

3.光源

工业相机和镜头是图像采集系统的关键组件,而合适的光源起到

;;;;;2.1.2图像分析与处理系统;;;;2.2常用数学方法;;;2.2.3标准化

标准化是一种常用的数据预处理技术,通过对数据进行比例缩放,将数据变换为均值为0,标准差为1的分布。标准化可以解决不同属性尺度不同的问题,使模型更加稳定和准确。

以零均值标准化为例,其形式为

式中,表示标准化后的结果;表示原数据;表示取值范围内所有数据的均值;表示该范围内所有数据的标准差。

;在机器视觉中,通过在卷积神经网络中使用标准化,将输入数据变换到相同尺度上,可以使模型更容易学习到图像中的特征,加速模型的训练,缓解网络梯度爆炸问题,加快模型的收敛速度,提高模型的训练精度。

2.2.4梯度下降

梯度表示函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向变化最快,变化率最大。梯度不是一个数值,而是一个标量。对于单变量函数,可以简单地理解梯度就是导数,而对于多变量函数,梯度则是由各偏导数组成的向量。

;对于求极值问题,若每次都能找到函数变化最快的方向,则问题即可迎刃而解,所以梯度法常用于函数求极值。对于求解极小值问题,每次找到函数下降最快的方向,则可快速接近目标,于是产生了梯度下降法。它的基本思想是以迭代的方式,按照负梯度的方向移动,从而逐渐接近函数的极小值。具体实现策略如下:

假设目标函数为,表示模型参数,表示学习率,表示样本数量,梯度计算方法为

;式中,表示模型对样本的预测值;表???样本的真实值;表示的第个特征值。

在每一次迭代中,通过计算所有样本的预测值与真实值之间的偏差累积作为梯度项更新模型参数,从而更新目标函数值,直到达到期望目标(一般是通过给设置阈值实现)。在实际应用中,梯度下降效果受到学习率和初始参数值的影响较大,需要根据情况合理选择。

在机器学习中,常用随机梯度下降法和批量梯度下降法。以随机梯度下降法为例,假设有1个一元线性回归模型,目标函数为

;式中,表示模型对样本的预测值;表示样本的真实值。再根据随机梯度下降的迭代公式计算

在机器学习中,梯度下降法的作用非常大。对于图像分类任务,梯度下降法用于训练CNN模型,计算每个卷积层和全连接层的梯度,并更新模型参数,实现模型的高效训练。在目标检测和图像分割任务中,梯度下降法可以用于训练模型的分类器和回归器,提高目标检测的准确率和速度。;2.3深度学习理论由来;;当M-P模型作为‘非运算’作用时,一般为单输入和单输出,如图2-3所示:

图2-3M-P模型非运算

计算公式为

2.逻辑与运算

当M-P模型作为‘与运算’作用时,一般为多输入和单输出。此时设为固定值,M-P模型的计算公式为;3.逻辑或运算

当M-P模型作为或运算作用时,一般为多输入和单输出。此时设为固定值,M-P模型的计算公式为

2.3.2感知机

感知机(perceptron)由Rosenblatt于1957年提出。感知机的输入是具有多个属性特征的向量,输出通常为二分类结果,它是支持向量机(SVM)和神经网络的原型基础。感知机的结构如图2-4所示,通过多个M-P模型加上损失函数组成,利用随机梯度下降法,对输入特征进行学习、

更新模型参数,获得准确的分类结果。;

图2-4感知机结构

单层感知机每个单元的计算公式为

式中,和分别表示权重和输入特征信息;表示偏置;表示符号函数。;单层感知机只能处理线性可分数据集,且无法实现异或操作,因此产生了多层感知机,用于解决复杂的分类问题。

多层感知机的结构可以分为输入层、隐含层和输出层,如图2-5所示:

其中输入层接收特征数据,隐含层(1层或多层)对输入特征数据进行非线性变换和运算,输出层输出预测结果。;假设训练数据为,其中

您可能关注的文档

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档