- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 要
人工神经网络是在现代神经生物学研究成果的基础上发展起来的一种模拟
人脑信息处理机制的网络系统,涉及生物、数学、物理、电子及计算机技术等各
门学科,目前已广泛的应用于图像处理、数据挖掘、模式识别、工程计算等领域,
并取得了令人瞩目的发展。
近年来,随着信息技术的不断发展,信息量呈现爆炸式增长,以“文本形式’’
存放的信息更是成为人们信息的主要来源。人们迫切的需要一个工具能从大量的
文本信息中快速有效的发现资源和知识,于是文本挖掘技术应运而生,其中对于
文本聚类的研究非常活跃,并取得了良好的成果。文本聚类是文本挖掘当中非常
重要的一个分支,涌现出了许多的聚类方法,如基于层次的方法、基于模型的方
法等,其中神经网络方法一自组织特征映射网络以其独特的优越性更是得到推
广和应用。
本文首先阐述了选题的背景和实际意义,并对该领域的国内外研究动态做了
简要介绍。综述了神经网络、文本挖掘的技术发展和研究方法,分析了神经网络
的优越性,讨论了神经网络应用于文本挖掘的可行性和有效性。其次对聚类算法
做了详细归纳和分析,并对比了主要的几种算法的优缺点。通过对自组织特征映
射网络的分析,指出初始化权值对网络的收敛有重大影响,提出了初始化权值优
化技术——覆盖方法,并应用Iris数据集做了测试。为了进一步提高文本聚类的
精度,提出了基于粒子群优化的TKSOM聚类算法。该方法通过粒子群优化算法
优化组合系数使获得的网络模型具有更好的识别能力,并且具有较好的自适应
性。最后设计并实现了一个小型文本聚类系统,验证了算法的有效性。
关键词 文本聚类 自组织映射覆盖方法粒子群优化
ABSTRACT
ABSTRACT
AnificialNeuralNetworksisanet、)lrork mehumanbrain
system
simulating
iIlfo珊ation baSedtllemodem
haIldlingmechanism,whichon
deVelops neurobiology
researchresults.ninVolVes
ando也er haSbeen usedin
technologysubjects.Cllrrently,itwidely manyareas,such
calculation,aIld
硒irIlageprocessing,datamilling,pattemreco印ition,engineering
achieVed
spectaculardeVelopment.
111recent wimtlleconstant ofinfomation
years,along deVelopment tecImology,
iIlfomationshows inf.0皿ationintextfomlbecomesthemain
explosiVe鲈owfll,觚d
sourceof needatooltofindresou∽esand
i11fomation.Peoplellrgently knowledge
the
and a numberofteXtiIlf01mlation.So of
quicklye简ciently劬mlarge tecllIlique
teXt h2Ls
文档评论(0)