重新认识P2P网络的拓扑.docVIP

  • 1
  • 0
  • 约6.34千字
  • 约 6页
  • 2018-01-06 发布于浙江
  • 举报
重新认识P2P网络的拓扑

重新认识P2P网络的拓扑 张国强(1,2) 袁斌(1,2) 张国清(1) (1)中国科学院计算技术研究所信息网络室,北京, 100080 (2)中国科学院研究生院, 北京, 100080 摘要:近年来,幂律现象在从社会关系网络到人造信息网络的各种各样的网络中被观测到。幂律似乎无处不在。然而人们在刻画新的网络时不考虑网络本身的演化过程而仅仅通过作图比较的方法做出某个网络节点度分布符合幂律的结论是不可取的,比如对于最近流行的P2P网络的刻画。本文在考察了P2P网络演化过程的基础上,从理论分析和仿真实验两个方面来证明P2P网络事实上是遵从负指数分布而非幂律分布。 关键字:幂律,P2P网络,拓扑结构 幂律和P2P网络的拓扑 近年来,人们在各种各样的实际网络中观察到了幂律分布。这些网络涵盖了从社会关系网络[3]到人造信息网络[2]的广大领域。在这些网络中,一个节点的度数为k的概率,其中c和r为常数。然而幂律现象的广泛存在也给人们一种假象:即似乎幂律无处不在。从而,当人们试图去刻画一个崭新的网络时, 首先想到的就是幂律。一种普遍的做法就是以Log-log形式画出节点的度分布,如果该图形与幂律分布稍有类似,就宣称该新的网络的节点度分布遵从幂律,比如对于P2P网络的刻画[1]。然而这不是一种值得提倡的方法,因为它并没有深入探索这个新的网络的演化机理。事实上,并非所有网络都呈现幂律特性。上述做法存在一个潜在的危险,即可能错误地把符合负指数分布的网络错误地归为幂律网络。这个错误产生的根源在于负指数分布和幂律分布在Log-log图中在一定的范围内具有一定的相似性,如果粗略地靠人眼辨别而不考虑网络自身的演化机理,则很可能会产生这样的错误。 产生幂律的两个基本元素已经被广为人知[4],即: 增长的网络(Growing Network) 即网络是增长的,而不是静止的。 优先附着规则(Preferential attachment) 即新加入的节点总是更倾向于和网络中的节点度较高的节点连接。 因此,刻画一个新的网络的正确办法首先必须建立在对于该网络演化过程的理解上。如果一个给定网络不满足以上两个基本元素的任何一条,那么去将度分布以Log-log图画出来, 在人眼观察的基础上就作出该网络符合幂律分布的结论就显得过于草率。 分布式非结构化的P2P文件共享网络,如Gnutella[8],是以自主式的方式构建网络。 文献[1]中提到,该网络也呈现了幂律分布,我们认为这个结论欠妥。文献[1]中给出的P2P网络拓扑节点度分布如图1所示, 其中,图1(a)的节点数在2000-3000之间,而图1(b)的规模在30000左右。 可以看出, 即使是作者认为符合幂律分布的图1(a), 实际上并不遵从幂律。我们在图上以黑色虚线作出了严格符合幂率分布的线条,可以看出, 距离幂律分布,最小度节点的数量差了30倍以上。另外,两个图的共同点在于高度节点的度数很低,并且,随着网络规模的增长,高度节点的度数并没有增加。从图1(a)到图1(b), 网络的规模增长了十几倍,但最大度数几乎没有增加。 这不符合幂律分布的特征,而是更符合负指数分布的规律。 Fig 1 Node connectivity distribution in Gnutella 图 1 Gnutella的节点度分布图 我们来考察导致幂律的两个因素。对于第一点,即该网络是一个动态增长的网络,没有任何疑问, P2P网络本身是一个动态增长的网络,用户网络规模的增大是很好的佐证。但该网络是否遵从优先附着规则则有待商榷。首先,很多Gnutella的实现在邻居选择上仅仅采用随机的策略,即任何已存在的节点被选作新加入节点的邻居的概率是相同的。其次,有部分Gnutella的实现考虑了节点的处理能力和带宽的差别, 因此,在选择邻居节点时,会优先考虑节点处理能力强或带宽较高的节点。 但是,该过程随着该节点度数的增加, 其吸引力是递减的, 即邻居越多,其剩余处理能力越少, 因此吸引力随着节点度的增加应该递减而非递增。另外, 由于受物理因素的限制,每个节点能够提供的连接个数具有上限,通常不超过100,这个数字对于一个10万规模的P2P网络来说几乎可以忽略。 因而,我们可以基本认为该网络不遵从优先附着的规则。在以下的内容中,我们将分别从理论分析和仿真实验的角度去证明该类网络实际上符合负指数分布而非幂律分布。 理论分析 首先,我们假设网络是一个动态增长的过程,每个新加入的节点都采用随机的方式选取邻居,每个已存在节点被选中的概率服从均匀分布。假设系统初始有m0 个节点,每过一个时间单元,一个新的节点加入系统。新加入的节点随机地与系统中已经存在的m个节点相连。该过程给人的第一印象会是节点的度分布符合二项分布,就像随机图一样,但结果不是如此。采用B

文档评论(0)

1亿VIP精品文档

相关文档