基于大数据和云计算的微信复杂网络及应用.pptxVIP

基于大数据和云计算的微信复杂网络及应用.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于大数据和云计算的微信复杂网络及应用

微信复杂网络与应用 Question 对腾讯来说,什么数据最珍贵? 来自业务的需求 • 喜欢听周董歌曲的用户 • 有送儿童节礼物需要的用户 • 高端,守信用的用户 挖掘过程:数据体系用户画像 WT层 RST层 MID层 RAW层 原始log 量的问题 纳尼?才一百万用户?我要二十倍! 分析共同点:社交性质 微信一度好友 微信社交网络(局部图) 社团识别算法简介 K-派系算法 相邻的 k-cliques Ø 两个 k-cliques 有共同的 k-1 节点 k-clique 社区 Ø k-cliques 的集合: 集合中的 clique 可以通过一系列相邻的 k-clique 相互 到达 k = 3 K-派系算法 相邻的 k-cliques Ø 两个 k-cliques 有共同的 k-1 节点 k-clique 社区 Ø k-cliques 的集合: 集合中的 clique 可以通过一系列相邻的 k-clique 相互 到达 k = 3 Community 1 Community 2 CNM算法(Clauset、Newman、Moore) CNM算法(Clauset、Newman、Moore) 社团识别算法优化 • 算法差异 • K派系精准,复杂度高 • CNM效果差些,复杂度低些 • 存在问题 • 不是同一个圈被拉进去 • 该合并的没有被合并 • 深度优化 • 综合运用各种算法 • 叠加关系链之外的数据 • 特定条件下合并 社团识别结果 社团分类模型 社团分类 同 事 同 学 同 学 亲 人 同 学 计算难点 • 规模大 • 点:6.97亿+ • 边:千亿+ • 复杂度高 计算框架——微信资源调度系统 • 微信后台强大 的服务器集群 • 空闲时跑挖掘计算 • 白天是你的, 晚上是我的 复杂网络应用——广告 • 10多倍扩散 效果依然很好 • 任意标签社交 Lookalike • 动态投放闭环处理 影响力 模型 行为特征 复杂网络应用——社交模型 亲人 同事 同学 拓扑特征 关系类型 社交圈子数 微信群数 转发行为 转发影响 复杂网络应用——People Rank • 网络+业务  用户分层 复杂网络应用——分析 • 微信人生——各关系类型随年龄变化 复杂网络应用——其它 • 征信、游戏、搜索、推荐…… 深入方向 • 社会层次关系 • 全局计算 • 更多业务应用

文档评论(0)

wyjy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档