- 10
- 0
- 约1.24万字
- 约 4页
- 2018-12-20 发布于山东
- 举报
rdNet在文本聚类中的应用研究.PDF
总第 184期 2009年 第 l0期
WordNet在文本聚类中的应用研究冰
饶洋辉 叶 良 程 洁
(中国科学院国家科学图书馆 北京 100190)
(中国科学院计算机 网络信息中心 北京 100190)
(中国科学院研究生院 北京 100049)
【摘要】针对文本聚类算法在应用方面存在的 “维灾”、簇的命名以及大规模的问题,运用WordNet词典进行词列
表的降维和词干化,提出并实现基于词性标注和WordNet相结合的并行文本聚类方法 ,最后和基于 Porter词干化
的文本聚类方法进行性能的比较。实验结果表明,该方法能大幅度降低词列表的维度,提高聚类的准确率和召回
率 ,同时增强各个簇的可理解性。
【关键词】WordNet 词性标注 文本聚类 并行K—Means
【分类号】TP311
Research on theApplicationofW ordNetin TextClustering
RaoYanghui’ YeLiang ChengJie
(NationalScienceLibrary,ChineseAcademyof
您可能关注的文档
最近下载
- Project 2 My Nature Park 项目式学习教学设计(小学英语三年级下册).docx VIP
- 保安员考试题库及答案(全优).docx VIP
- DL 5190.4-2019 电力建设施工技术规范 第4部分:热工仪表及控制装置.pdf VIP
- iPACS-5747站用变保护测控装置技术说明书V2.01.pdf VIP
- 导流洞固结灌浆和回填灌浆施工技术措施.doc VIP
- 帷幕灌浆准表样.doc VIP
- 豆砾石回填灌浆、固结灌、超前钻孔灌浆、排水孔(管)技术要求.doc VIP
- 2024年鄂尔多斯市总工会社会化工会工作者招聘考试真题.docx VIP
- 回填灌浆准灌证.doc VIP
- 预应力锚索灌浆工程准灌证.doc VIP
原创力文档

文档评论(0)