余弦度量和适应度函数改进的聚类方法.pdfVIP

余弦度量和适应度函数改进的聚类方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第42 卷 第4 期 电 子 科 技 大 学 学 报 Vol.42 No.4 2013年7月 Journal of University of Electronic Science and Technology of China Jul. 2013 余弦度量和适应度函数改进的聚类方法 1 1 1 1 2 施侃晟 ,刘海涛,白英彩,宋文涛,洪亮亮 (1. 上海交通大学电子与电气工程系 上海 徐汇区 200030; 2. 中国孵化中心 杭州 310053) 【摘要】K-均值算法因其简单和高效性,在文本聚类中占有重要地位。针对传统的K-均值算法对初始点敏感、易陷入局 部最优的问题,结合遗传算法已经成为一种趋势。在充分发挥K-均值算法的高效性的同时,该文利用遗传算法的全局自适应 优化特点克服了对初始点敏感的问题。同时,以余弦度量评价对象间的相似性并以此构造新的遗传算法适应度函数、收敛准 则以及遗传算法种群更新方式,提高了K-均值和遗传算法这种结合方式的聚类精度,并增强了该结合算法的稳定性。 关 键 词 遗传算法; 适应度函数; K-均值算法; 相似性度量; 文本聚类 中图分类号 TP18 文献标志码 A doi:10.3969/j.issn.1001-0548.2013.04.017 Text Clustering Method with Improved Fitness Function and Cosine Similarity Measure 1 1 1 1 2 SHI Kan-sheng , LIU Hai-tao , BAI Yin-cai , SONG Wen-tao , and HONG Liang-liang (1. College of Electronic and Electric Engineering, Shanghai Jiaotong University Xuhui Shanghai 200030; 2. China Incubating Center Hangzhou 310053) Abstract The traditional K-means algorithm is widely used because of its simplicity and efficiency. However, it is sensitive to the initial point and easy to fall into local optimum. In this paper, we use cosine measure to evaluate the similarity between objects and construct a new fitness function of genetic algorithm and the new convergence criterion for K-means algorithm. Experimental r

文档评论(0)

higu65 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档