04-社会网络分析和算法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
社会网络分析与算法研究 回顾 n   随机网络的特征 ① 节点的度分布 :遵循泊松分布 ② 平均距离 : ③ 聚类系数 : 2 第四章 幂律分布与无标度网络 n 小世界模型的特征 ① 节点的度分布: WS小世界模型是所有节点的度都近似 相等的均匀网络。 ② 平均距离 :较小 小世界网络的平均距离下降的原因 在于两个节点间出现了最短路径 (捷径)。 ③ 聚类系数 :较高 3 流行度现象 n   流行度是一种极端不平衡的现象: Ø   绝大部分人一生只在与他/她们直接相关的社会圈子里被认知 ,少 数人有广泛的知名度 ,而极少数人具有全球范围的知名度。 Ø   同样 ,书籍、电影或者是任何有受众的事物都存在这种现象。 Ø   如何量化这种不平衡 ?为什么会产生这样的不平衡 ?它们是否在某 种程度上反映出流行现象本身特有的内在特性 ? n   以万维网为例 ,测量每个网页的流行度。定义指向某个网页的 所有链接为该网页的链入集合 ,就可以利用一个网页的链入数来测 量该网页的流行度。 4 流行度现象 n   正态分布: 平均值和标准方差。 Ø 观察到一个偏离均值c倍于标准差的值的概率随c以指数率递减。 Ø   正态分布是一种很自然的猜测 ,因为它在自然科学领域普遍存在。 Ø   中心极限定理对正态分布的大量出现提供了基本解释 :粗略的说 , 中心极限定理表明 ,如果考虑任何独立的小的随机量集合 ,在极限情 况下 ,这些随机量的和结果将服从正态分布。 n   以万维网为例 ,假定每个网页独立的随机决定是否连接到一个给定的 网页 ,那么给定网页的链入数等于多个独立的随机量值之和 ,我们希望 它服从正态分布 :那么 ,拥有k个链入链接数的网页当k增大时 ,应该以 指数形式减少。 5 n   实际发现 ,拥有k个链入数的网页数量比例近似的与1/k²成正比。 n   函数1/k²当k增加时 ,降低得比较缓慢 ,也就是说实际拥有很大链入数量 的网页相当普遍 ,超出预期的正态分布。 n   其他领域也有类似流行度的幂律分布。 6 流行度现象 n   正态分布广泛应用于自然科学领域。 n   幂律分布成为复杂网络(社会网络 )中的一种规范。 n   如何检测一个数据集是否服从幂律分布 : Ø   设f(k)表示某个整体中属性值为k的那部分所在份额 ,希望证明方程 f (k ) =a /k c 成立或者近似成立 ,其中指数c和系数a均为常数。 f (k ) =ak −c Ø   如果将方程写成 ,对等式两边去对数得到 : log f(k) = log a – c log k 如果存在一个幂律关系 ,那么以logk作为变量的函数log f(k)将是一条 直线 ,斜率为-c ,log a为直线与y轴的相交点。对数图可以验证一组数据 是否呈现近似幂律的关系。

文档评论(0)

feiyang66 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档