张俊林:标签传播算法在微博用户个性化建模的应用.pdfVIP

张俊林:标签传播算法在微博用户个性化建模的应用.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
标签传播算法在微博用户兴趣图谱的应用 张俊林 新浪微博-搜索部-推荐组 2012-6-28 About me • 中科院软件所 博士 • 《这就是搜索引擎:核心技术详解》作者 • 现任职新浪微博,从事语义分析,推荐系统, 搜索技术,社交挖掘等方面研发工作 提纲 • 用户兴趣图谱的重要性 • 标签传播算法 • 使用标签传播算法计算微博用户兴趣图谱 • 大规模数据计算问题 • 算法效果示例 什么是用户兴趣图谱 • 用户兴趣图谱 – 个性化概念 – 根据用户的行为以及用户产生的内容等方方面面的数据来从中 导出用户可能的兴趣点 – 用户个性化兴趣建模 兴趣图谱的用途 • 个性化建模 • 推荐感兴趣的信息 –感兴趣的人 –感兴趣的微博 –感兴趣的新闻 –感兴趣的图片 –感兴趣的群组 –定向广告推送 兴趣图谱的用途 • 订阅微博重排序 –智能排序 构建用户兴趣图谱可利用的信息 • 微博环境下有很多可利用信息 –发表的微博内容 –转发评论的微博内容 – 自标签 – 参加的群组 – 参加的投票 – 我关注的人 – 关注我的人 – 社交行为 – …………. 构建用户兴趣图谱可利用的信息 • 本讲座主要涉及到的信息 –发表的微博内容 –转发微博内容 – 自标签 – 社交行为 – …………. 提纲 • 用户兴趣图谱的重要性 • 标签传播算法 • 使用标签传播算法计算微博用户兴趣图谱 • 大规模数据计算问题 • 算法效果示例 标签传播算法 • 社交网络挖掘中很常用 – 自动挖掘社交关系中的“团结构” – 优点 • 思路非常直观和简洁,易理解易实现 • 容易实现对大规模数据进行处理,具备很强的实用性 标签传播算法 • 问题:对于社交网络S,如何通过标签传播算 法自动发现其中的密集连接子图? • 基本思路 – 初始阶段 • 为图中每个节点赋予一个独一无二的标签L – 多轮迭代 • 通过社交关系(即图的边)将标签向其它节点传播 • 某个节点node将根据与其有边联系的其它节点的标签来决 定自己此轮应该赋予哪个标签 – 将其邻居节点的标签中出现次数最多的那个标签赋予自己 – 如果邻居节点的标签数目一样多,无法找出最多个数标签 ,则随机赋予一个标签即可 标签传播算法 • 简单示例 提纲 • 用户兴趣图谱的重要性 • 标签传播算法 • 使用标签传播算法计算微博用户兴趣图谱 • 大规模数据计算问题 • 算法效果示例 使用标签传播算法计算微博用户兴趣图谱 • Recap:利用到的信息 –发表的微博内容兴趣词 –转发微博内容兴趣词 – 自标签 – 社交行为 使用标签传播算法计算微博用户兴趣图谱 • 构建图结构 – 图节点:用户ID –节点之间的边:社交信息 • 转发 • 评论 • @U – 初始标签 • 内容兴趣词 • 自标签 – 基本假设 • 如果两个用户之间的互动越频繁,那么两者之间的社交关 系越紧密,而亲密的社交关系往往蕴含着潜在的兴趣关联 或者较强的线下社交关系。 使用标签传播算法计算微博用户兴趣图

文档评论(0)

7号仓库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档