社区显着性度量.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
社区显着性度量.ppt

程学旗 中国科学院计算技术研究所 SEWM 2008 互联网服务:对Massive People的追逐 Web2.0:病毒扩散式的应用 搜索技术与两种社会效应 信息网络的社会化与社区化 社区分析是一个基础性问题 社区分析是大规模复杂信息网络研究的一个基础性问题 对网络的社会关系挖掘、信息扩散的涌现性分析、网络稳定性判定等具有重要意义 将网络抽象成层次化的社区,可以降低整个网络建模与分析的复杂性 社区结构反映了网络中个体节点行为的区域性特征,对个性化服务具有重要价值 像PageRank、HITS等链接分析方法对集中式搜索起着重要作用一样,Web2.0时期,社区分析将对社交网络、博客搜索、论坛挖掘等具有重要作用 大规模信息网络中的社区结构 一般意义上,社区结构是大规模网络中普遍存在的基本结构,即:一个网络是由大量内部连接“紧密”、外部连接“稀疏”的子团组成,这些具有统计显著性的子团结构成为一个网络的社区结构 信息网络中,社区通常对应着功能相同、性质相近或者关系密切的节点集合 社会关系网络中的朋友圈子 Web网络中的相近主题的页面集合 蛋白质交互网络中,功能相近的蛋白质集合 大规模信息网络中的社区结构 现有的社区分析方法:寻找网络的自然划分 图划分:聚合式/分裂式方法 代表方法:基于betweenness的方法. S. Fortunato, V. Latora, M. Marchiori. A Method to find community structure based on Information Centrality, Phys. Rev. E 70,056104,2004 图划分:基于连边密度的方法 代表方法:基于modularity的方法. M. E.J.Newman. Finding and evaluating community structure in networks, PRE 69,026113,2004 信息编码方法 代表方法:网络编码方法. M. Rosvall and C.T. Bergstrom. An information-theoretic framework for resolving community structure in complex networks. PNAS 104(18),2007 重叠社区发现方法 代表方法:k子团(k-clique). G. Palla etc. Uncovering the overlapping community structure of complex networks in nature and society. Nature 435(7043),2005 社区发现: 基于结构划分显著性度量的网络结构分析 子团连边密集度的度量:模块性(Modularity) 基本思想 社区是连边密度较高的区域 随机网络没有社区结构 通过度量网络划分的好坏度量网络社区结构 定义为 Eii :实际划分的子集内部连边密度 Aibi:相同划分的同等规模随机网络中子集内部的节点连边密度 社会信息网络中社区分析的几个问题 节点之间的多维关系度量 距离(多关系的度量)不符合三角不等式: (DAB+DAC) vs. DBC Dimensionless 社会信息网络中社区分析的几个问题 节点之间的多维关系度量 距离(多关系的度量)不符合三角不等式: (DAB+DAC) vs. DBC Dimensionless 社区显著性度量 社会信息网络中社区分析的几个问题 节点之间的多维关系度量 距离(多关系的度量)不符合三角不等式: (DAB+DAC) vs. DBC Dimensionless 社区显著性度量 社区的重叠性与社区关系之间多模态分析 社会信息网络中社区分析的几个问题 节点之间的多维关系度量 距离(多关系的度量)不符合三角不等式: (DAB+DAC) vs. DBC Dimensionless 社区显著性度量 社区的重叠性与社区关系之间多模态分析 社区的信息演化性 结构演化性 内容/功能演化性 信息网络中社区分析的几点探索 基于信息瓶颈的社区发现 层次化重叠社区发现 社区核心成员的识别 融合社区关系的专家搜索 基于信息瓶颈的社区发现 多维关系信息网络中,基于单一关系度量的结构显著性判定方法存在无法避免的距离度量偏差 从信息网络编码角度来看,社区结构可以看成是网络拓扑稳定性的一种呈现。如果通过压缩网络而不失去稳定性的网络拓扑骨架,则网络的社区结构水落石出。 基于信息瓶颈社区发现 基于信息瓶颈的社区发现 基本思想 使用两个随机变量X和Y表示网络拓扑结构 压缩其中一个随机变量X,得到压缩表示C,使I(C,X)尽可能小(即压缩比尽可能大)且I(X,Y)尽

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档