- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
社会网络分析与算法研究
回顾
n 随机网络的特征
① 节点的度分布 :遵循泊松分布
② 平均距离 :
③ 聚类系数 :
2
第四章 幂律分布与无标度网络
n 小世界模型的特征
① 节点的度分布: WS小世界模型是所有节点的度都近似
相等的均匀网络。
② 平均距离 :较小
小世界网络的平均距离下降的原因
在于两个节点间出现了最短路径
(捷径)。
③ 聚类系数 :较高
3
流行度现象
n 流行度是一种极端不平衡的现象:
Ø 绝大部分人一生只在与他/她们直接相关的社会圈子里被认知 ,少
数人有广泛的知名度 ,而极少数人具有全球范围的知名度。
Ø 同样 ,书籍、电影或者是任何有受众的事物都存在这种现象。
Ø 如何量化这种不平衡 ?为什么会产生这样的不平衡 ?它们是否在某
种程度上反映出流行现象本身特有的内在特性 ?
n 以万维网为例 ,测量每个网页的流行度。定义指向某个网页的
所有链接为该网页的链入集合 ,就可以利用一个网页的链入数来测
量该网页的流行度。
4
流行度现象
n 正态分布: 平均值和标准方差。
Ø 观察到一个偏离均值c倍于标准差的值的概率随c以指数率递减。
Ø 正态分布是一种很自然的猜测 ,因为它在自然科学领域普遍存在。
Ø 中心极限定理对正态分布的大量出现提供了基本解释 :粗略的说 ,
中心极限定理表明 ,如果考虑任何独立的小的随机量集合 ,在极限情
况下 ,这些随机量的和结果将服从正态分布。
n 以万维网为例 ,假定每个网页独立的随机决定是否连接到一个给定的
网页 ,那么给定网页的链入数等于多个独立的随机量值之和 ,我们希望
它服从正态分布 :那么 ,拥有k个链入链接数的网页当k增大时 ,应该以
指数形式减少。
5
n 实际发现 ,拥有k个链入数的网页数量比例近似的与1/k²成正比。
n 函数1/k²当k增加时 ,降低得比较缓慢 ,也就是说实际拥有很大链入数量
的网页相当普遍 ,超出预期的正态分布。
n 其他领域也有类似流行度的幂律分布。
6
流行度现象
n 正态分布广泛应用于自然科学领域。
n 幂律分布成为复杂网络(社会网络 )中的一种规范。
n 如何检测一个数据集是否服从幂律分布 :
Ø 设f(k)表示某个整体中属性值为k的那部分所在份额 ,希望证明方程
f (k ) =a /k c
成立或者近似成立 ,其中指数c和系数a均为常数。
f (k ) =ak −c
Ø 如果将方程写成 ,对等式两边去对数得到 :
log f(k) = log a – c log k
如果存在一个幂律关系 ,那么以logk作为变量的函数log f(k)将是一条
直线 ,斜率为-c ,log a为直线与y轴的相交点。对数图可以验证一组数据
是否呈现近似幂律的关系。
原创力文档


文档评论(0)