- 1
- 0
- 约2.77万字
- 约 13页
- 2026-02-27 发布于北京
- 举报
具有给定预期度和强度的网络的快速无偏抽样
XuanchiLi,XinWang,and
SadamoriKojaku
4400VestalParkwayE,SchoolofSystemsScienceandIndustrialEngineering,
BinghamtonUniversityP.O.Box6000Binghamton,NY13902-6000
skojaku@
摘要配置模型是网络结构统计评估的基石。虽然Chung-Lu模型是最广泛
本使用的配置模型之一,但它系统地过度采样了高度节点之间的边,导致不
准确的统计结论。尽管最大熵原理提供了无偏的配置模型,但其高昂的计
译算成本阻碍了广泛应用,使得Chung-Lu模型成为不准确但持续实用的选
中择。在这里,我们通过调整Miller-Hagberg算法提出了针对基于最大熵模
3型的快速高效采样算法。在103个经验网络上的评估显示速度提高了10-
v1000倍,使理论上严谨的配置模型变得实际可行,并有助于更准确地理解
0网络结构。
3
2
3Keywords:网络采样,配置模型,抽样偏差
1
.
9
01介绍
5
2
:网络是随机和非平凡结构的混合体,这些结构通常难以区分~[7,14,20,
v
i22,23]。例如,像富人俱乐部~[7,33]、嵌套性~[16,26,12]以及核心-外围结
x
r构~[14,32,31,3]这样的显然非随机结构可以完全从度数异质性中产生。配
a
置模型——生成具有预定度序列的随机网络[4,8]——为统计测试提供了一
个严格框架,用以对抗空模型,作为网络分析的基础[6,18,20,27,2,13,15]。
最广泛使用的配置模型是Chung-Lu模型[4]。Chung-Lu模型的一个
关键限制是在大型度节点之间的边被过度采样[29,18,28,17]。虽然这种偏
差是众所周知的,并且在稀疏网络中通常被认为是可以忽略的[5,21],但
在网络分析中这种偏差是有意义的,因为大型度节点是决定网络结构的关键
因素。
Chung-Lu模型中的系统偏差激发了若干替代方法。组合方法被提出,
通过精确计数网络配置来计算边概率,特别是对于密集网络[28]。尽管组
合方法主要关注无向、无权网络,但网络的最大熵(MaxEnt)模型提供了
2XuanchiLietal.
一个灵活且理论上严谨的框架,可以扩展到不同类型网络的应用中,包括加
权、有向和二分网络[25,29,30]。然而,由于两个关键计算瓶颈的存在——
参数推断和网络采样,MaxEnt模型在实际应用中仍未被广泛采用。推断瓶
颈要求解决一个至少包含个变量的非线性优化问题,导致计算复杂度超
过。这一挑战最近通过高效的求解器得以解决[24,30]。然而,采样
瓶颈仍未得到解决,暴力算法是唯一可行的方法来从MaxEnt模型中采样网
络。暴力方法评估所有可能节点对的边概率,需要进行次概率计算,
导致大规模网络分析中的计算复杂度变
原创力文档

文档评论(0)