基于社会标注系统的Web用户聚类算法-计算机应用研究.PDF

基于社会标注系统的Web用户聚类算法-计算机应用研究.PDF

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第30卷第12期 计 算 机 应 用 研 究 Vol.30No.12 2013年12月  ApplicationResearchofComputers Dec.2013 基于社会标注系统的Web用户聚类算法 1 2 3 卢 露 ,赵 靖 ,魏登月 (1.上海电力学院计算机科学与技术学院,上海200090;2.安徽科技学院理学院,安徽 凤阳233100;3.武 汉大学计算机科学与技术学院,武汉430079) 摘 要:针对Web用户聚类时,社会标注系统中用户访问资源数据稀疏从而导致传统聚类算法效率不高的问 题,提出了一种三向迭代聚类算法,对用户、标签和资源分别聚类,利用三者之间的关联关系不断相互交叉迭代 调整,直到各聚类簇达到稳定为止。实验表明,该方法调整后类的内聚性更强,区分度更大,能有效解决数据稀 疏性问题,提高用户聚类效果。 关键词:社会标注;大众分类;三方网络;迭代聚类 中图分类号:TP391;TP301.6   文献标志码:A   文章编号:10013695(2013)12355703 doi:10.3969/j.issn.10013695.2013.12.009 Webuserclusterbasedonsocialtaggingsystem 1 2 3 LULu,ZHAOJing,WEIDengyue (1.SchoolofComputerScience&Technology,ShanghaiUniversityofElectricPower,Shanghai200090,China;2.ScienceCollege,Anhui Science&TechnologyUniversity,FengyangAnhui233100,China;3.SchoolofComputer,WuhanUniversity,Wuhan430079,China) Abstract:Aimingattheproblemofthesparseusers’accessresourcedataresultinginlowefficiencyoftraditionalclustering algorithms,thispaperproposedatripartiteiterativeclusteringalgorithm,whichclustertags,resourcesandusersrespectively andthenusedtherelationsamongthemtocrossiterativelyadjustcontinuously,untilallclustersachievedstabilitystatussothat thedistanceswithintheclusterweremuchsmallerwhereasthedistancesbetweentheclusterswereevenbigger.Experiment showsthatthismethodcaneffectivelysolvethedatasparseproblem,andimprovetheeffectofuserclustering. Keywords:socialtagging;folksonomy;tripartitenetwork;iterativecluster   随着Web2.0的兴起,社会标注成为一种重要的个性化服 特征对基于相似度的聚类算法会产生较大的负面影响,大大降 务信息。它允许用户根据对资源的理解,自由选择一些标签来 低了聚类效果。虽然文献[14]提出的奇异值分解(SVD)降低 描述资源特征(资源可以为文本、歌曲、图片、网络连接、产品 了项目资源的维数,使得用户—资源矩阵变得

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档