- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
改进蚁群算法在文本聚类中应用研究
改进蚁群算法在文本聚类中应用研究
[摘要]本文对于标准的蚁群聚类算法进行改进,主要为了指导蚂蚁的行为减少算法中过多的随机因素,为此设立了两个导航器。其中一个为蚂蚁选择合适的放下文档的位置提供指导,以及在蚂蚁放下文档后指引蚂蚁重新选择新文档;另一个导航器则保证蚂蚁可以遍历到尽可能多的文档。另外通过对比较概率以及蚂蚁观察半径的动态调整,增强了蚂蚁对环境的适应性。经过试验可以得到更好的聚类效果。
[关键词]蚁群算法;文本聚类;导航器;
[中图分类号]TP301.6[文献标识号]A[文章编号]1009-9646(2009)07(a)-0000-00
1 引言
蚁群算法是近年来诞生的一种基于群体智能的算法,在若干领域已取得了成功的应用。此外,其在一些实际问题的应用也取得一定的进展,如大规模集成电路综合布线以及网络数据包的路由。随着蚁群算法研究的兴起,人们发现在某些方面采用蚁群模型进行聚类更加接近实际聚类问题,其在文本聚类的应用正逐步引起人们的关注。
蚁群算法最早是1991年由Deneubourg对真实蚂蚁群中蚁卵分类行为进行观察之后提出的蚁卵分类模型[1],该模型利用个体与个体及个体与环境的交互作用,实现自组织聚类,其过程可以简单的描述为:首先将n个数据对象随机投放在一个m m的平面上,然后每只蚂蚁随机的选择一个数据对象,根据该对象在局部区域的相似性进行计算而得到概率,然后根据概率决定蚂蚁是否“拾起”、“移动”或者“放下”该对象。经过有限次的迭代,平面上的数据对象按其相似性而聚集,也就是相近的一类数据对象聚集到了一起,从而得到聚类结果和聚类数目。
2 蚁群算法的改进
本文对蚁群聚类算法进行了研究,发现在一些情况下不能得到满意的聚类结果。其原因可归结为两个方面:一方面蚁群算法中蚂蚁的行动缺乏目的性;另一方面,当蚂蚁周围的环境发生变化时,蚂蚁的状态不能做出调整。本文针对以上问题对蚁群聚类算法进行优化。
2.1 对蚂蚁的行为进行指导
为了增强蚂蚁行为的目的性,尽量减少蚂蚁行为的随机因素。研究人员为此在LF算法里就为蚂蚁增加了记忆功能[2],他的作用就是其记录了蚂蚁最近放下的t个文档的位置。通过这种方法指导蚂蚁下一步的操作,但通过对LF算法的分析,结果发现在LF算法中的记忆器所发挥的作用不是很大。这样局部的记忆器就部分的失去了其记忆作用。
本文为了能真正体现出蚂蚁记忆器能为蚂蚁指引移动方向的功能,本文为蚂蚁增加了两个全局的带有记忆功能的导航器来指导蚂蚁的行动。
导航器一:存储所有文档的文档编号。导航器的记忆长度是所有文档的个数。其作用是:当蚂蚁拾起文档后,为蚂蚁选择合适的放下文档的位置提供指导,并在蚂蚁放下文档后,为蚂蚁重新选择新文档提供明确的指引。
当一个新的文档被拾起后,蚂蚁要选择新位置进行移动,移动之前,蚂蚁要遍历导航器一所有的文档编号,不包括被其他蚂蚁拾起的文档(因为被拾起的文档的位置是不确定的),然后计算在每个文档所处位置的群体相似函数F,然后选取最大的F-MAX(F),记录下MAX(F)对应文档位置的坐标POS(x,y)。此位置为蚂蚁当前的最佳移动位置,但为了防止算法过早成熟,本文并未强迫蚂蚁移动到POS处,但此位置蚂蚁会重点考虑,所以本文采用蚂蚁以一个较大的概率(在算法初始化时定义,比如:70%)移向POS处的方法,如果不移向POS处,则为蚂蚁随机分配一个位置。当蚂蚁放下文档后,需要选择新文档拾起,再结合导航器二(下文有介绍)遍历导航器一中所有的文档编号,计算自身未曾拾起,并且此时也没有被其他蚂蚁拾起的所有文档中群体相似度最小的文档,作为选择的新文档,并移动到新文档所在的位置,此导航器的优势在于适当的保留随机因素的前提下可以在全局范围内为蚂蚁的“移动”、“拾起”提供较明确的指导性。
导航器二:主要功能是记录此蚂蚁曾经拾起过和其他没有拾起过的文档。如果蚂蚁频繁的对几个文档拾起而不去拾其他文档,则可以通过导航器二避免这种情况。导航器二规定了蚂蚁对某个文档最多的拾起次数t,如果超过t则此蚂蚁不再拾起此文档。这保证了蚂蚁可以遍历到尽可能多的文档,而不会陷入对局部文档频繁的“拾起”、“放下”中。蚂蚁记忆长度是所有文档的个数N。
此导航器的目的是加强蚂蚁拾起文档时的目的性。以往的算法中,当蚂蚁放下一个文档,再给此蚂蚁随机分配一个文档,加入此导航器后,蚂蚁便把文档分为两类:己经被拾起过t次的文档,拾起次数不到t次的文档。当蚂蚁在放下一个文档后,遍历此导航器,在拾起次数不到t次的文档中,计算每个文档在其位置处的群体相似度函数F,然后找出一个最小的F设为MIN(F),然后找出MIN(F)所对应的文档,然后把这个
您可能关注的文档
- 改良局部切除术治疗十二指肠乳头肿瘤临床价值.doc
- 改良岛状皮瓣在手部组织缺损与手指修复中临床应用.doc
- 改良尿道板纵切卷管法在治疗小儿尿道下裂中应用价值分析.doc
- 改良封闭负压辅助闭合技术联合干细胞移植治疗难愈合性伤口研究.doc
- 改良布朗氏架在股骨粗隆间骨折保守治疗中应用.doc
- 改良平片无张力疝修补术在腹股沟疝中应用.doc
- 改良小切口白内障摘除及人工晶状体植入联合青光眼复合小梁切除术临床疗效观察.doc
- 改良式B―Lynch缝合术在剖宫产产后出血治疗中应用价值.doc
- 改良式B―Lynch缝合术对剖宫产术中子宫收缩乏力性出血作用.doc
- 改良小夹板外固定治疗桡骨远端伸直型骨折效果探析.doc
原创力文档


文档评论(0)