rdNet在文本聚类中的应用研究.PDFVIP

  • 10
  • 0
  • 约1.24万字
  • 约 4页
  • 2018-12-20 发布于山东
  • 举报
rdNet在文本聚类中的应用研究.PDF

总第 184期 2009年 第 l0期 WordNet在文本聚类中的应用研究冰 饶洋辉 叶 良 程 洁 (中国科学院国家科学图书馆 北京 100190) (中国科学院计算机 网络信息中心 北京 100190) (中国科学院研究生院 北京 100049) 【摘要】针对文本聚类算法在应用方面存在的 “维灾”、簇的命名以及大规模的问题,运用WordNet词典进行词列 表的降维和词干化,提出并实现基于词性标注和WordNet相结合的并行文本聚类方法 ,最后和基于 Porter词干化 的文本聚类方法进行性能的比较。实验结果表明,该方法能大幅度降低词列表的维度,提高聚类的准确率和召回 率 ,同时增强各个簇的可理解性。 【关键词】WordNet 词性标注 文本聚类 并行K—Means 【分类号】TP311 Research on theApplicationofW ordNetin TextClustering RaoYanghui’ YeLiang ChengJie (NationalScienceLibrary,ChineseAcademyof

文档评论(0)

1亿VIP精品文档

相关文档