基于语义高维数据聚类技术.pdfVIP

  • 8
  • 0
  • 约1.7万字
  • 约 5页
  • 2017-11-03 发布于湖北
  • 举报
第5期 电 子 学 报 Vd.37No.5 A口隗Ⅱ正a限ONICASINICA 2009 2009年5月 May 基于语义的高维数据聚类技术 刘铭,王晓龙,刘远超 (哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001) 摘襄:本文提出一种有效处理高维数据的聚类算法,算法首先通过构造特征链将文档集合划分为多个类别。 同时在相似度计算及权值调整时考虑相似特征的影响以凝聚语义相似的文档,并动态调整文档权重使分布不平衡的 文档得到充分训练.实验表明:该算法在高维空间能够获得较好的聚类结果,类内相似度高,类间区分性好,迭代次数 较少. 关键词: 语义相似度计算;自组织映射;特征链;权值调整 中圈分类号:TPl8 文献标识码: A 文章编号:0372-2112(2009)05-0925.05 for DimensionalDataBasedonSemantics TechnologyHigh Clustering LIU Yuan-chao M吨,WANGXiao-long,LIU (s幽“旷凸|,j}懈蛔搿谢死dl,蝴。//a—o/nlna曲uu矿死dlI嘶,凰l椭.胁哦哨胁150∞1.‰) A按虹限ct:Anovel for datais in衄s in. dus自吲ng蜊thmhi曲凼∞∞画跚I矗l pf晖岱ed p叩管.TKs蛳£陆firstpsrd丘ons B咄clust∞s feature italsocomkhstheeffectsof蛐featuresin 叫d0咖叫喊into by咖呦删ng chaim.Simulumeoualy semantic similarities,and 曲面崩钞co豳口吐adonand猢醣gkadi瑚眦m毛oag醇。田瞄啦daam搬如with dynamicallyad§嘞w汹 tO Call ofdocumentsmakeⅢ妇11anceddoa删swell demonsU-眦th址itob恤in bett盯cluster- uained.D叩豇in僦results relatively inter-duster alsohaslessiterafivetimes. disd嘎:嘲。and i辈results蚋也highimza-cluster罐回瑾翟删鼬and semantic w吣: similarity K目y con3tx眦ion;self,xga此zmgmaple;feam把chain;weigt吐adjustment 的特征构造成特征链并通过反映不同信息的特征链将 1引盲 文档集合划

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档