- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于敏感性分析裁剪Madaline网络结构.pdf
基于敏感性分析裁剪Madaline 网络结构
邵静
河海大学计算机及信息工程学院,南京 (210098)
E-mail:Joykelly811005@
摘 要:在神经网络研究中,网络结构如何设计是一个至关重要的问题。为了找到一个适合
的网络结构,目前常用的方法是把已训练好的大结构网络裁剪成小结构网络,同时又要保留
它必需具备的某些属性。本文给出了基于敏感性的裁剪方法,即从 Madaline 网络上裁剪其
隐层神经元节点,造成尽可能少的性能损失并可以比较简便地补偿裁剪造成的损失。这种方
法的新颖在于它建立了一个重要性度量,通过对一个 Adaline 的敏感性度量,找到一个
Madaline 中重要性最小的Adaline 。我们的实验结果很好的证明了这个方法的有效性。
关键词:Adaline ,Madaline ,裁剪,敏感性度量,重要性度量
中图分类号:TP183
1. 引言
自从1943年McCulloch和Pitts首先提出神经元的数学模型以来,人工神经网络的发展几
经兴衰。虽然该研究领域在理论和应用上都已有很大的进展,但是离彻底解释人脑的工作原
理还相差甚远,实用的也仅仅是人脑功能的极少部分。许多有关人工神经网络的结构和行为
的基本问题都还有待进一步深入探索。本文主要研究的是基于敏感性的Madaline 网络结构的
裁剪。
2. 问题描述与研究现状
在一个待解决的问题中,用什么样的神经网络结构是一个合适的结构?很可惜,这个问
题的答案不容易给出,因为结构大的网络和结构小的网络都各有利弊。一方面,结构较大的
网络训练速度可能更快,对训练数据分类精确;但是在硬件上可能运行时间长、计算量大,
而且对于给定的训练数据以外的数据,泛化性能较差。而另一方面,结构较小的网络在运行
时间和计算量上可能花费的是较少,而且泛化能力强;但是它对训练数据可能训练速度慢甚
至根本不能训练起来。研究者们结合大小网络的优缺点,已给出了一些方法来寻找合适的网
络结构。它们大致分成两类,一类是构造法,另一类是裁剪法。以上这两种方法,相对而言,
裁剪法在文献中较为常见,而且它还结合了训练大网络和运行小网络的优点,使之显得更为
合理。本论文仅考虑对Madaline 网络结构的裁剪。
Madaline 是一种离散的前向多层神经网络,采用有监督的学习机制,适合于解决许多
固有性质为离散型的问题,诸如信号处理和模式识别问题。此外,它的离散特性可以使硬件
执行更容易,构造上消耗少,减少计算复杂度,便于计算方面的理解和解释。事实上,一个
Madaline 网络可以被理解为连续性前向多层神经网络的一个特殊例子。众所周知,连续型前
向多层神经网络在技术上是最成熟的,例如著名的后向传播学习算法。但由于Madaline 的
硬极限激活函数是不可微分的,故绝大多数的方法不能直接应用于 Madaline 网络。因此,
即使在多层感知机的裁剪上有了一些解决方法,仍需要探究一些新的方法来满足 Madaline
的特性。本文主要讨论怎样裁剪只有一个隐层的Madaline 网络的隐层神经元。
关于前向神经网络的裁剪方法,Reed [1] and Engelbrecht [2] 给出了详尽的综述。虽然出
现了许多不同的裁剪方法,但他们中绝大多数的基本主要思想是几乎一致的。他们都试图建
立一个合理的重要性度量,并希望基于这种重要性度量的裁剪,可以对整个网络的性能影响
-1-
达到最小。在所有裁剪法中,基于敏感性的裁剪方法最为常见,它通常估算出目标函数的敏
[3,4] [5,6]
感性,如训练误差 的敏感性,测试误差 的敏感性,或者由于
您可能关注的文档
最近下载
- 2025年出境竹木草制品台帐表单各种表格.pdf VIP
- DB34T 4822-2024 地下水监测井建设技术规范.pdf
- 中国热射病诊断与治疗指南(2025版).pptx
- 第19课社会生活的变迁(课件)-八年级历史下册教学无忧备课课件(统编版).pptx VIP
- 铁路预应力混凝土桥梁智能张拉与压浆施工技术规程.pdf VIP
- DL∕T 1685-2017 油浸式变压器(电抗器)状态评价导则.pdf
- 2025春人教鄂教版(2024)小学科学一年级下册《纸制品》教案及反思.docx VIP
- 建设工程标准化协会标准:TCECS 717-2020 城镇排水管道非开挖修复工程施工及验收规程.pdf
- XX县压缩天然气城市气化工程初步设计说明书.doc
- 调 式 中 的 音 程.pptx VIP
文档评论(0)