- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社会化标签系统中基于本体的个性化推荐方法研究
社会化标签系统中基于本体的个性化推荐方法研究
摘要:[目的]捕捉用户兴趣的动态性变化,优化个性化信息推荐效果。[应用背景]高效的个性化信息推荐方法可以根据用户行为特征主动为用户提供合适的信息资源,使信息的获取和利用更加快捷、准确。[方法]以“新浪微博”为例,通过挖掘用户及其关注者的微博数据,提取标签,计算二者兴趣相似度及亲密度,确定用户兴趣标签并优化标签描述,从而构建用户个性化“轻量级”本体,使得语义网资源能够准确地投放到用户界面。[结果]有效缓解了信息爆炸式增长所造成的“信息迷航”现象。[局限]微博数据中的杂音(广告转发、多语言描述)、数据不充分等,可能影响标签提取的准确性。关键词:标签本体;个性化推荐;社交网络
中国论文网 /8/view-7219554.htm
1 引言
随着Web2.0的发展,互联网从信息传播的媒介逐渐转变为信息资源共享和社会交流的平台。用户既是信息的使用者,也是信息的创造者。用户和信息的爆炸式增长,为人们带来丰富信息资源的同时,也造成用户难以准确找到感兴趣的资源。高效的个性化信息推荐方法可以根据用户行为特征主动为用户提供合适信息,使信息的获取和利用更加快捷、准确。
社会化标签方法是一种更强调“感知性”的信息组织方法,它由用户自发对资源进行标注所产生的标签组成,为发现用户关注点、进行个性化信息推荐提供了重要的数据基础。与此同时,标签本身所暴露出的描述不规范、无序化、多样性、缺乏语义关系等,很大程度上制约了其在提取个性化信息方面所发挥的作用。而本体是共享概念模型的明确形式化规范说明,能系统地表示概念间的内在语义关系,是语义构建的重要手段,可以有效地弥补上述缺陷。目前,在个性化信息推荐方面有关应用标签和本体的研究相互间比较孤立,缺少将两者结合起来建立模型的思想。本文以主流社交网络“新浪微博”为例,提供了一种在社会化标签系统中基于本体的个性化信息推荐方法,用以捕捉用户兴趣的动态性变化,优化个性化信息推荐效果。
2 相关研究
标签是用户主观地对感兴趣的资源进行发布时所使用的关键词,它在体现用户兴趣取向的同时,也反映了资源本身的特征属性。标签在由用户、标签、资源三者组成的社会化标签系统中扮演着核心角色,是用户与资源之间的桥梁。规范标签的使用、实现标签语义的明确化表述,是降低标签滥用率、提高检索效率的有效手段。
近年来,针对个性化推荐方法的研究不胜枚举。根据推荐算法的不同,YooDonghee等提出了UCTag新型标注方法,设计了基于Web的文件管理系统原型,用户提交某一标签后,根据相应的规则得到的标签本体,系统会自动推荐一系列符合用户兴趣的标签。Kawakubo等提出一种基于Folksonomy的图片本体的自动构建模型,并利用Flickr网站的数据进行实验旧。张云中提出一种基于FCA的半自动构建本体方法,使用造格算法将形式背景转化成相应概念格,再由知识工程师对概念格进行分析,将结果上传到社区,经由社区成员对本体校正或补充得出改进后的本体模型,重新应用到社区中。
目前大多数应用标签系统进行个性化信息推荐的研究集中在推荐算法的设计优化上,没有考虑标签本身的局限性,降低了个性化信息推荐的准确性。本文将本体与标签相结合,用以提高社会化标注系统的推荐效果。
3 研究方法
本文将用户Ul及其关注用户V发布的微博数据作为研究样本,分别对样本进行预处理、提取标签。计算用户Ul的标签集IU1中的每一个兴趣i与用户V标签IV1、IV2……IVn间的相似度及亲密度来判断二者间的社会相关度,从而得到可以代表用户Ul兴趣的标签集。该标签集是从用户及其关注者发布微博的内容角度入手,得到的结果集是无层次结构;而本体是一类规范的集合,具有层次结构和语义性。因而,将标签与本体相结合,对用户兴趣标签集进行规范化、层次化处理、通过分析标签之间的语义关系,建立能够反映用户兴趣的标签概念空间模型,构建用户自身的“轻量级本体”,映射已标记语义网资源的标签集,系统自动将匹配Top-k标签的资源信息反馈给用户。
4 基于本体的个性化信息推荐模型
4.1 构建模型
本文将标签系统与本体二者相结合,构建了一种适用于社交网络的个性化信息推荐模型,如图1所示。该模型对社会化标签的含义做了进一步扩展,使标签不再是用户以标注某个资源为目的去标注的,而是用户在进行正常的网络社交活动中,系统自动根据用户的活动数据信息进行提取的,这种方式在很大程度上提高了标签的容错性和准确性,能够实时、准确地监测用户兴趣变化,更加高效地向用户提供所需资源,优化了社交网络中个性化信息推荐服务的效果。
4.2 标签提取模块
如图1所示,根据用户微博内容,提取关键词作为该用户的标签。本文采用哈尔滨工业大学语言技术
文档评论(0)