竞争型神经网络及在聚类分析中的应用的研究.pdf

竞争型神经网络及在聚类分析中的应用的研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘 要 聚类分析是数据挖掘中一个重要的研究领域,传统的聚类方法在特定的情形下取得 了良好的效果,但是当处理海量数据、具有复杂数据类型的数据集时,仍存在若干尚未 解决的问题。 如今竞争型神经网络已经在模式识别、聚类等方面得到了广泛应用,并显示出与传 统聚类方法相比所具有的优势。但是竞争型神经网络存在“死’’点问题,某些神经元在 竞争中可能始终未能获胜而成为“死神经元”,不仅造成神经元的浪费,而且造成训练 误差偏大,无法达到训练误差的精度要求,不能很好完成它所担负的聚类或分类任务。 另外神经网络受网络拓扑结构和训练样本的影响,对输入数据的冗余属性很不敏感,所 以训练速度一般较慢。 粗糙集理论作为人工智能领域的一个新的研究热点,它可以弥补神经网络不能确定 哪些知识是冗余的,哪些知识是有用的,训练规模过大和训练时间过于漫长的局限性。 所以在数据挖掘过程中,粗糙集理论可用于数据挖掘的数据预处理部分。但是粗糙集理 论只能处理离散属性,而实际生活中的数据大多数是连续的属性值,因此需要首先对数 据进行离散化处理,这已成为粗糙集理论实用性的瓶颈。 本文提出利用改进的竞争型神经网络进行聚类的方法,主要研究内容和成果如下: Vector 1针对“死”点问题,深入探讨了LVQ(Learning 且通过引入阈值学习规则,均衡神经元获胜的机会,较好地解决了该类网络在遇到“死’’ 点时训练误差偏大的问题。 2针对粗糙集理论只能处理离散数据的局限性,提出了基于竞争型神经网络的连续 属性离散化方法。首先使用条件属性与决策属性之间的决策关系来度量条件属性的重要 性,并据此对条件属性按照重要性由小到大排序,然后利用竞争型网络分类功能找到连 续属性的断点,从而实现了对连续属性的离散化。 3根据上面提出的理论方法,首先解决了竞争型神经网络中存在的“死”点问题并 对输入样本进行离散化处理,通过知识约简删除输入样本的冗余属性,简化了知识表达 空间维数,然后将简化以后的样本数据作为神经网络的训练样本,从而达到了简化神经 网络的输入规模和提高训练速度的目的。最后提出了一种新的基于改进型LVQ神经网 络的聚类方法。 4最后,在这些工作基础之上,作者将本文提出的聚类方法应用到河南省的土壤数 据中,对土壤数据进行聚类,验证改进算法的有效性和正确性,实验结果表明该聚类方 法的确很有效果。 关键词:竞争型神经网络,聚类,离散化,阈值,“死点 Ⅱ ABSTRACT Thecluster isan areaofresearchindata traditional methods analysisimportant mining.The clustering haveachieved therearea when with resultsin numberofissues good specificcases,but dealinghuge data amounmof ordatasetswith data complextypes. has neuralnetworkbeen usedin and Nowadayscompetitive widely patternrecognition,clustering other withthetraditional methodsitshows a aspects.Compared clustering greatadvantages.Butproblem called‘blind inthe n

您可能关注的文档

文档评论(0)

liybai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档