- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
57 23 2013 12
第 卷 第 期 年 月
社会媒体用户标签的分析与推荐
■ 涂存超 刘知远 孙茂松
[ ] Web2. 0 , 、 ,
摘 要 微博是 时代重要的 网络服务工具 作为以用 户为 中心的信息发布 传播 和分享平台 它
。 , 。 ,
包含 了非常丰 富的用户信息 在微博中 可以使用标签表示用户的兴趣和属性 而一个用户的兴趣和属性 通
。 ,
常 包含在这个用户的文本信息和 网络信息 中 针 对微博 用户的标签进行分析 提 出网络正则化 的标签分发模
( NTDM) 。NTDM ,
型 来为用户推荐标签 模型对用户个人 简介中的词语和标签之 间的关 系进行建模 同时利 用其
社交 网络结构作为模型 的正 则化 因子 。在 真实数据集 上 的 实验表明 ,NTDM 在 效 果 以及效 率上 都优于其 他
方法。
[ ]
关键词 用户标签推荐 微博 标签分发模型 随机 游走
[ ]G350
分类号
DOI : 10. 7536 /j. issn. 0252 - 3116. 2013. 23. 004
1 社会媒体用户标签介绍及统计分析
作为 Web2. 0 ,
一个 时代的流行应用 微博为用户
[1]
提供了一种全新的分享信息和表达观点的方式 。在
微博 , ,
中 用户可以发布限定长度的短消息 也可以关注
。
他们感兴趣的其他用户 正是由于具备了其他类型社
, 。
交媒体不同的功能 微博刚出现就获得爆发式的增长 1
图 新浪证券微博信息
2010 , ,
年初 新浪微博仅仅拥有数百万的注册用户 而
数据 , ,
集上 统计了不同标签数量的用户分布情况 如图
2012 , 5
到了 年底 新浪微博的注册用户数量便达到了
2 所示:
亿的规模。
,
微博用户数量的迅速增长 为成熟社交网络的形
。 ,
成奠定了用户基础 在这个社交网络中 用户节点之
,
间的联系不断增加 每个用户产生的文本信息也不断
。 ,
增加 所以说 微博是一个典型的包含用户丰富信息
的社交网络。
为了更好地对用户属性进行建模并提供高质量的
, , ,
个性化服务 许多微博服务 例如新浪微博 允许用户
。
给自己标注若干标签来描述自己的兴趣或者属性 以
文档评论(0)