第2章 神经网络基础.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第2章神经网络基础

本章学习目标

了解神经网络的基本概念与发展历程

掌握从生物神经元到人工神经元的关键抽象

理解感知机的结构、学习规则及其局限性

掌握多层感知机的结构、反向传播算法及通用近似理论

熟悉深度学习兴起的关键技术与挑战(梯度消失/爆炸、过拟合等)

掌握卷积神经网络的核心思想与操作,了解其经典架构

掌握循环神经网络与LSTM的核心原理及其在处理时序数据中的应用

本章介绍

本章先向读者介绍神经网络的基本原理,从感知机模型出发探讨多层感知机与反向传播算法如何解决复杂的非线性问题;再介绍卷积神经网络如何利用局部连接与权重共享成为处理视觉信息的基石;最后介绍循环神经网络及长短时记忆网络在处理时序数据与长距离依赖中的关键作用,并回顾深度学习的发展历史。

2.1从感知机到深度学习:智能的“大脑”雏形

人形机器人在足球场上驰骋时,这是一个高度复杂的具身智能系统如何感知环境、进行决策并执行动作。这一系列看似流畅的行为,背后离不开一个关键的智能处理核心——神经网络。它如同机器人的“大脑”,负责解读传感器传来的海量数据,并发出精确的控制指令。本章将深入浅出地介绍神经网络的基本原理与发展脉络,为理解人形机器人如何实现智能足球对抗奠定坚实的理论基础。

2.1.1人造“大脑”

想象一下人形机器人足球运动员站在绿茵场上,它的“眼睛”(摄像头)捕获到了一幅数字图像:一个绿色的背景,几条白色的线条,一个圆形的球,以及几个移动的色块(对手机器人)。对于计算机而言,这幅图像仅仅是一个巨大的数字矩阵,每个数字代表一个像素点的亮度或颜色,如图2.1所示。如何让机器从这一堆冰冷的数字中“理解”到:“这是一个足球场”、“那个圆形物体是球”、“那个色块是正在靠近的对手”、“我需要跑上前去踢球”?

图2.1足球场上机器人的感知系统

这个过程,就是感知和认知的过程,它需要一个“大脑”。在具身智能中,这个大脑的核心组件之一就是人工神经网络。本节将追溯这个“大脑”的进化史,从最简单的单细胞生物一感知机,一直到如今复杂的深度神经网络。理解这一演进过程,对于掌握现代人工智能的基石至关重要。

2.1.2生物神经元与人工神经元

人工神经网络的概念并非凭空产生,其灵感直接来源于自然界最复杂的智能系统——人类大脑。而理解大脑的钥匙,则始于其基本计算单元:生物神经。

1.发现之旅:从微观世界到神经科学基石

对神经元的认识与显微镜技术的发展密不可分。19世纪末,西班牙圣地亚哥?拉蒙·卡哈尔(SantiagoRamónyCajal,1852-1934)通过改良的高尔基染色法,首次在显微镜里清晰观察到脑组织中彼此独立却又相互连接的完整神经元结构。他提出的“神经元学说”颠覆了此前将神经系统视为连续网状结构的旧观念,确立了神经元是神经系统结构与功能的基本单位,为后续研究奠定了基础。卡哈尔也因此荣获1906年诺贝尔生理学奖。

如图2.2(a)所示,一个典型的神经元主要由以下部分构成:

细胞体:神经元的代谢与控制中心,进行核心的信息整合处理;

树突:如同分枝繁茂的树木,负责接收来自成千上万个其他神经元的输入信号;

轴突:一条细长的纤维,作为神经元的输出通道,负责将处理后的电信号传递至下游神经元;

突触:连接一个神经元的轴突末端与另一个神经元树突或细胞体的特殊节点,其连接强度(即突触效能)决定了信号传递的效率。

图2.2神经元模型

神经元的信息处理展现出一种精巧的“整合-发放”机制。树突从大量突触处接收化学或电信号,这些信号在细胞体内进行时空整合(summation)。这并非简单的累加,有些输入起兴奋作用,有些则起抑制作用。如果整合后的信号净强度在短时间内超过了某个临界点一即阈值一神经元就会被“激活”,产生一个全或无的、沿轴突快速传导的动作电位。值得注意的是,突触的强度并非固定不变,它会根据神经活动的频率和模式动态调整,这种“突触可塑性”被认为是学习和记忆最根本的生物学基础。

2.从生物学到数学模型的关键抽象

如何将这种复杂的生物机制转化为可计算的模型。这一跨越性的思想由神经科学家沃伦?麦卡洛克(WarrenMcCulloch,1898-1969)和逻辑学家沃尔特·皮茨(WalterPitts,1923-1969)在1943年共同完成。他们极大地简化了生物神经元的复杂性,提取出3个核心特征,构建了开创性的人工神经元模型:

多输入:模拟树突,接收多个输入信号;

权重:模拟突触强度,每个输入信号拥有一个可变的权重(代表兴奋或抑制);

阈值激活:模拟细胞体的整合功能,对加权求和后的信号应用一个阈值函数,决定是否产生输出。

这一抽象将神经元视为一个二值逻辑设备,虽然简化了生物细节,

文档评论(0)

暖意 + 关注
实名认证
文档贡献者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年08月18日上传了教师资格证

1亿VIP精品文档

相关文档