一种基于LDA的潜在语义区划分及Web文档聚类算法.pdf

一种基于LDA的潜在语义区划分及Web文档聚类算法.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于LDA的潜在语义区划分及Web文档聚类算法

第25卷第l期 中文信息学报 V01.25.No.1 11 201 PRoCESSINGJan.·20 1年1月 J()URNALOFCHINESEINF()RMATIoN 文章编号:1003-0077(201I)01-0060—06 一种基于LDA的潜在语义区划分及Web文档聚类算法 刘振鹿1,王大玲1’2,冯时1,张一飞h2,方东昊1 (1.东北大学信息科学与工程学院,辽宁沈阳110819; 2.医学影像计算教育部重点实验室(东北大学),辽宁沈阳110819) 摘要:该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频,中频、高频语义区,以低频语义区 的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义互作 用机制对聚类结果进行修正。与相关工作比较。该文不仅应用LDA模型表示文档。而且进行了深入的语义分布区 域划分,并将分析结果应用于Web文档聚类。实验表明,该文提出的基于LDA的文档类别与语义互作用聚类算 法获得了更好的聚类结果。 关键词:LDA;潜在语义;语义分布;文档聚类 中图分类号:TP391 文献标识码:A Web An ofLatentSemanticPartitionand Document Approach Space Clustering LIUZhenlu‘.WANG Shil,ZHANGYifeil”,FANG Dalin91”,FENG Dongha01 (1.SchoolofInformationScienceand 110819,China; Engineering,NortheasternUniversity,Shenyang,Liaoning ofMedieal 2.KeyI。ahoratory ImageComputing,NortheasternUniversity, ofEducation l10819,China) Ministry Shenyang,I,iaoning semanticsofdocumentsand thesemantic Abstract:This theLDAmodeltO latent partition paperapplies analyze into and semanticsinlow areusedtOdetectoutlier low,middlehigh space.The frequencyspace space frequency in aredevotedtodocument asfeaturesof webdocuments.Thesemanticsmiddleand highfrequencyspace clustering

您可能关注的文档

文档评论(0)

yaobanwd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档