基于动态筛选的社交网络高影响力节点集识别算法研究.pdfVIP

  • 2
  • 0
  • 约10.15万字
  • 约 67页
  • 2023-02-11 发布于江苏
  • 举报

基于动态筛选的社交网络高影响力节点集识别算法研究.pdf

摘 要 近年来,随着社交平台的蓬勃发展,各种各样的社交平台出现在人们的日常 生活当中,人们交换信息的能力达到了前所未有的速度,且留下了海量的数据给 商家和企业进行挖掘利用。作为社交网络分析领域的关键问题之一,影响最大化 问题(Influence Maximization Problem, IMP)受到研究者们的广泛关注,它从社交 网络中选择一组用户(称为种子集) 以最大化预期的影响用户数量(称为影响力扩 散) 。影响最大化问题具有广泛的应用场景,例如口碑营销、检测必需蛋白质、 无线传感器部署等,因此具有重要的研究价值和现实意义。 现有的影响最大化算法主要分为三类。其中基于贪心框架的影响最大化算法 和智能优化的影响最大化算法虽然有着较好的效果,但随着网络规模的爆发式增 长,上述两类算法由于时间复杂度高、内存需求大而无法适用于大型网络。基于 网络特征的启发式算法因其低时间复杂度、计算效率快等优点受到人们广泛关注。 现有的基于网络特征的算法选择出的种子集在进行信息扩散时容易受网络中“富 俱乐部”现象的干扰,导致种子集的传播范围有大量的重叠,这不利于信息在网 络中广泛传播。为解决上述两个问题,本文提出一种基于动态筛选的影响最大化 算法(Influence Maximization algorithm, IMax) 。为保证种子节点具有较好的传播能 力,IMax 算法将度中心性考虑进来。为了使IMax 算法生成的种子集间的传播范 围尽可能少的重叠,本文通过广度优先遍历计算节点间的距离来选择尽可能“远 离”种子节点集的节点加入种子集。为了更准确地刻画节点潜在的信息传播能力, 我们通过衰减节点的度来降低种子节点邻居加入种子集的可能性,并使用候选节 点集来完成这一目标。针对节点度的衰减,本文提出两种策略,其一为将种子节 点邻居的度衰减为0,命名为Zero-IMax ;另一为将种子节点邻居的度衰减为现有 度的1/2,命名为Half-IMax 。 为验证本文所提算法的有效性,将本文所提的算法在 14 个真实公开的数据 集上同5 种目前流行的影响最大化算法在SIR 模型上进行实验对比分析。实验结 果表明本文方法拥有良好的性能和稳定性,且显著优于Degree 算法、H-index 算 法、K-shell 算法,在多数情况与VoteRank 算法、LIR 算法效果相当,有时甚至 优于VoteRank 算法与LIR 算法。 关键词:社交网络;影响最大化;启发式算法;动态筛选;SIR 模型 1 目 录 1 绪论 1 1.1 研究背景与意义 1 1.1.1 研究背景 1 1.1.2 研究意义 2 1.2 国内外研究现状 2 1.2.1 基于贪心框架的算法 2 1.2.2 基于智能优化的算法 3 1.2.3 基于网络特征的算法 4 1.3 本文研究内容 5 1.4 本文组织架构 6 2 相关理论知识 8 2.1 社交网络 8 2.2 影响最大化问题 9 2.2.1 问题定义与描述 9 2.2.2 基本研究路径 9 2.3 影响最大化算法 10 2.3.1 贪心算法 10 2.3.2 Degree 算法11 2.3.3 H-index 算法 12 2.3.4 K-Shell 算法 15 2.3.5 VoteRank 算法 16 2.3.6 LIR 算法 18 2.4 影响传播模型 19 2.4.1 独立级联模型 19 2.4.2 线性阈值模型 20 2.4.3 SIR 传染病模型 21

文档评论(0)

1亿VIP精品文档

相关文档