具有给定预期度和强度的网络的快速无偏抽样.pdfVIP

  • 1
  • 0
  • 约2.77万字
  • 约 13页
  • 2026-02-27 发布于北京
  • 举报

具有给定预期度和强度的网络的快速无偏抽样.pdf

具有给定预期度和强度的网络的快速无偏抽样

XuanchiLi,XinWang,and

SadamoriKojaku

4400VestalParkwayE,SchoolofSystemsScienceandIndustrialEngineering,

BinghamtonUniversityP.O.Box6000Binghamton,NY13902-6000

skojaku@

摘要配置模型是网络结构统计评估的基石。虽然Chung-Lu模型是最广泛

本使用的配置模型之一,但它系统地过度采样了高度节点之间的边,导致不

准确的统计结论。尽管最大熵原理提供了无偏的配置模型,但其高昂的计

译算成本阻碍了广泛应用,使得Chung-Lu模型成为不准确但持续实用的选

中择。在这里,我们通过调整Miller-Hagberg算法提出了针对基于最大熵模

3型的快速高效采样算法。在103个经验网络上的评估显示速度提高了10-

v1000倍,使理论上严谨的配置模型变得实际可行,并有助于更准确地理解

0网络结构。

3

2

3Keywords:网络采样,配置模型,抽样偏差

1

.

9

01介绍

5

2

:网络是随机和非平凡结构的混合体,这些结构通常难以区分~[7,14,20,

v

i22,23]。例如,像富人俱乐部~[7,33]、嵌套性~[16,26,12]以及核心-外围结

x

r构~[14,32,31,3]这样的显然非随机结构可以完全从度数异质性中产生。配

a

置模型——生成具有预定度序列的随机网络[4,8]——为统计测试提供了一

个严格框架,用以对抗空模型,作为网络分析的基础[6,18,20,27,2,13,15]。

最广泛使用的配置模型是Chung-Lu模型[4]。Chung-Lu模型的一个

关键限制是在大型度节点之间的边被过度采样[29,18,28,17]。虽然这种偏

差是众所周知的,并且在稀疏网络中通常被认为是可以忽略的[5,21],但

在网络分析中这种偏差是有意义的,因为大型度节点是决定网络结构的关键

因素。

Chung-Lu模型中的系统偏差激发了若干替代方法。组合方法被提出,

通过精确计数网络配置来计算边概率,特别是对于密集网络[28]。尽管组

合方法主要关注无向、无权网络,但网络的最大熵(MaxEnt)模型提供了

2XuanchiLietal.

一个灵活且理论上严谨的框架,可以扩展到不同类型网络的应用中,包括加

权、有向和二分网络[25,29,30]。然而,由于两个关键计算瓶颈的存在——

参数推断和网络采样,MaxEnt模型在实际应用中仍未被广泛采用。推断瓶

颈要求解决一个至少包含个变量的非线性优化问题,导致计算复杂度超

过。这一挑战最近通过高效的求解器得以解决[24,30]。然而,采样

瓶颈仍未得到解决,暴力算法是唯一可行的方法来从MaxEnt模型中采样网

络。暴力方法评估所有可能节点对的边概率,需要进行次概率计算,

导致大规模网络分析中的计算复杂度变

文档评论(0)

1亿VIP精品文档

相关文档