深度学习案例教程教案3.1手写数字识别任务介绍.docx

下载文档

0
0
约1.91千字
约 6页
2025-03-03 发布于山东
举报
版权申诉
保障服务

深度学习案例教程教案3.1手写数字识别任务介绍.docx

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

(p1)同学们，大家好。

我们本节课来学习第三章

简单全连接网络的手写数字识别。

(p2)在学习之前，首先我们先明确一下我们的学习目标。

在本章学习中，我们会了解到全连接神经网络的发展历程。

掌握感知机模型和多层感知机模型的结构。

掌握不同激活函数的定义与区别。

掌握反向传播算法的原理以及梯度下降法。

能使用神经网络模型实现手写数字识别。

(p3)还有我们的素质目标。

能够使用神经网络知识分析问题、解决问题。

能够主动获取最新的研究成果与技术发展。

提高分析问题，解决问题的能力。

培养团队合作和沟通表达能力。

(p4)我们本章的实践任务主要有以下4项。

手写数字数据集处理。

全连接神经网络模型搭建。

模型训练、

模型测试与评估。

(p5)接下来我们来学习第一节内容。

手写数字识别任务介绍。

我们来了解一下它的业务场景与需求。

比如说，当我们在银行办理业务时。

可能会遇到需要填写支票或者汇票的情况。

由于我们手写这些支票和汇票时，

存在着字迹可能不清晰或者数字难辨认这些问题。

这会导致银行工作人员花费大量时间来进行人工识别和分类。

同时呢，也可能会产生错误。

为了解决这个问题。

需要设计并实现一个手写数字识别模型。

满足银行系统对于支票、汇票手写数字的自动识别需求。

如果银行采用了这样的手写识别技术，

将大大提高业务的效率和准确性。

我们将学习全连接网络的手写数字识别技术。

掌握神经网络的模型训练。

来模拟银行支票、汇票填写这些业务场景和识别。

帮助大家更好的去理解和掌握手写数字识别技术。

（p6）那对于这个任务，

我们来看一下对于技术的要求，以及技术分析。

手写数字识别是一个典型的图像分类问题。

在传统的方法中，我们需要对数字图像进行特征提取，

然后使用分类器对提取的特征进行分类，

但是呢，这种方法存在着一些局限。

首先对特征提取的要求比较高。

其次，对分类器的复杂性要求也比较高。

相比之下，神经网络模型可以直接从原始数据中学习这些特征，

再通过反向传播算法优化模型参数，

从而实现高效且准确的分类。

（p7）

全连接网络是最基础的神经网络模型之一，

它主要由三层网络构成，输入层、隐藏层和输出层。

输入层它主要用来接收原始的一个图像数据，

并将其转化为网络可处理的形式。

隐藏层呢，它是通过一系列的线性变换和非线性变换，对数据进行特征提取。

输出层则将提取的特征与目标进行匹配和分类。

在全连接网络中，我们的输入层，隐藏层和输出层。

它的每个节点都是与上一层的所有节点相连的，

因此呢，我们也被把它称为密集连接层。

（p8）

我们把全连接网络中节点与节点之间的连接，称为权重

权重具有一个具体的数值

权重也决定了数据在网络的流动过程，

权重的数据量和节点的数据量是正相关的，

换句话说全连接网络越复杂，意味着节点越多，也就意味着权重越多

如此多的权重依靠人为去调整到最佳数据，工作量非常大，显然也是不切实际的

那么，在我们这个全连接网络的训练过程中，通常采用梯度下降算法，通过最小损失函数来优化模型的权重参数。

从而来实现这个分类的准确性。

关于梯度下降算法我们会在后续的课程中为大家详细介绍

（p9）

在我们训练过程中呢，一般会容易出现拟合的现象啊。

过拟合是指神经网络模型在训练数据上表现很好，

但在新数据上表现不佳的现象。

简单来说，就是模型过于依赖于训练数据，无法很好地泛化到新数据。

举个例子，想象一下，如果你学习一段材料，可能会背诵得很好，

但是并不代表你真正理解了这个材料。

如果你只是死记硬背，而没有理解材料的本质，

那么当遇到新的问题时，你也许就无法正确地应用这个材料。

类似地，神经网络模型在训练数据上表现很好，

可能只是因为模型过于依赖于训练数据的细节，

而没有真正理解数据中的本质规律。

这就导致了模型在新数据上的表现不佳，

因为新数据可能包含了训练数据中没有出现过的情况，

而模型无法正确地处理这些情况。

（p10）

那么在实际的神经网络训练任务中，我们如何来避免过拟合呢？

通常过拟合的解决方法包括：增加更多的训练数据、减少模型的复杂度、使用正则化等方法。

这些方法的本质是让模型更好地理解数据的本质规律，

而不是过分依赖于训练数据的细节。

（p11）

总之呢，我们这个全连接网络是一种简单有效的神经网络模型，

它能够解决手写数字识别等图像分类问题。

那么我们这个手写数字识别实现过程，

主要是通过数据采集啊，然后神经网络模型搭建，

通过数据集进行训练啊，

然后完成模型测试，

这就是我们手写数字识别任务的一个过程。

好，本节对于手写数字识别任务，我们就介绍到这里。

您可能关注的文档

文档评论（0）

xiaobao + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

深度学习案例教程教案3.1手写数字识别任务介绍.docx