基于潜在语义空间维度特性的多层文档聚类.pdfVIP

基于潜在语义空间维度特性的多层文档聚类.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
清华大学学报(自然科学版)2005年第45卷第S1期 —ISSN10—00-0054 CN 1i-2223/NJ Univ(SeiTech),2005,V01.45,No.S1 Tsinghua 基于潜在语义空问维度特性的多层文档聚类 刘云峰1, 齐欢1,HU CAI 代建民1 Xiang’an2, Zhiqian92, (】.华中科技大学系统工程研究所,武汉430074; 2.Instituteof of 38152,USA) IntelligentSystems,UniversityMemphis,Tennessee,Memphis,TN 摘要:为实现文档在不同概念层次下的自动聚类,研究了 潜在语义分析(1atentsemantic 潜在语义空间中维度的统计特性,发现对应大奇异值的维度 是一种基于潜概念索引的自然语言统计模型,已被广 描述了语义元素间的共性,对应小奇异值的维度描述了语义 泛应用于信息检索、文档聚类、自动问答系统等领域 元素间的特性,呈现出潜在语义空间维度与概念粒度之间隐 中。基于概念的文档聚类技术近年来发展迅速,潜在 含的对应关系。基于这种认识,通过采用不同维度来实现文 语义分析与其他基于概念的文档聚类方法相比,优势 档在不同概念粒度下的聚类,并获得了很好的聚类准确率。 在于需要人的参与性少,可计算性和可操作性强。 另外,在基于潜在语义分析的文档聚类算法中,采用文档自 检索矩阵的行向量,代替低维文档向量作为聚类对象,获得 知识结构存在隐含的层次性,不能简单地用同 了更好的聚类准确率。 等层次的类别来划分,采用合理的知识层次结构有 关键词:信息处理;潜在语义分析;文档自检索矩阵;文档 利于知识的组织和管理,因此多层次文档聚类的研 聚类;概念粒度 究越来越受到关注。本文提出一种基于LSA的多层 次文档聚类算法。 391 中图分类号:TP 文献标识码:A 文章编号:1000—0054(2005)S1—1783—04 1潜在语义分析基本方法 潜在语义分析认为自然语言中存在某种潜在语 documents Multi—hierarchy based 义结构,支配词语的使用和文档的构成。LSA利用 onLSA clustering space value character 截断的奇异值分解(singular dimensionality LIU Huanl,HU SVD)生成的低维潜在语义空间来描述语言元素间 Yunfen91,OI Xiang’en2, CAI Zhiqian92,DAIJianminl 的语义结构。不同于向量空间模型(vectorspac

文档评论(0)

聚文惠 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档