大学课程《社交大数据分析方法与应用》PPT课件:02-社交网络背景与描述性指标.pptVIP

大学课程《社交大数据分析方法与应用》PPT课件:02-社交网络背景与描述性指标.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

路径与连通性的邻接矩阵表示如果节点i和j之间有一条边,则.即i和j之间的存在长度为1的路径;如果节点i和j之间有一条长度为2的路径,则存在另一个节点k,使得,则两个节点之间长度为2的不同路径数目为:一般地,两个节点i和j之间长度为r的不同路径数目为:*网络的推广——超图超图的定义:超图(Hypergraph)是一种广义的图,特点是一条超边可以连接多个点。其中一条超边上的点可以表示家庭成员,一篇文章的共同作者等。*网络的推广——二部图二部图也称二分图(bipartitegraph):是图论里的一种特殊模型,将图里的顶点分为两个集合,且集合内的点没有直接关联。二部图可以表示用户与商品关系,男女婚姻关系等。二部图的单模映射:*超图与二部图的转化超图可以用二部图刻画:*网络的基本统计量度的定义及求法节点i的度:节点i连接的边数,记为:;所有节点度的平均值称为网络的平均度(averagedegree),记作对无向无权网络,有:*有向网络的度节点i的出度和入度:分别表示指出去的边数和连进来的边数,记作:;节点i指向节点j则,;出、入度的平均度:*加权网络的节点强度无向有权网络;有向有权网络*平均路径长度最短路径/距离:表示节点i与j之间的距离;平均路径长度(averagepathlength):*广度搜索算法*求节点i到j的距离:1,从节点i开始,并标记为0;2,找节点i的邻居,并标记为1;3,上一次新加入的点标记为n,把网络中未标签且和标记为n相连的点标记为n+1;4,重复步骤3直到节点j被找到,或者不存在未标记的点。5,j到i的距离,就是对应的标签。如果j没有标签,说明无路径。调和平均和直径当网络不连通时,有些节点的距离为,导致平均路径长度,则原有定义失效。处理方法:1)仅仅考虑最大连通子图的平均距离;2)定义调和距离(harmonicmean):网络直径:网络中任意两点距离的最大值*聚类系数聚类系数(clusteringcoefficient):任两个邻居之间也是朋友的概率。ki表示节点i的度,Ei节点i的邻居中实际存在的边数,则有聚类系数的几何描述:*上图中的左图为三角形,右图为三元组,左图包括3个三元组。基于邻接矩阵求聚类系数给定无向无权邻接矩阵,只有,这三点才能构成三角形,因此聚类系数可以由下式求得(1/2是因为算了两次)利用,进一步有整个网络的平均聚类系数:*聚类系数的另一种定义社会学对聚类系数的定义,称为(transitivity):注1:分子的因子3由于每个三角形对应于3个不同的连通三元组,分别以3个顶点为中心构成的连通三元组。注2:两种定义计算的结果可能不一样,但是不带来本质影响。在下图中,根据社会学的定义,有8个连通的三元组,1个三角形,故聚类系数为3/8。根据原始定义有:*度分布度分布p(k):任选一个节点,其度为k的概率,其中设网络大小为N,度为k的节点数为,则有,给定度分布p(k),可以得到,*度分布例题*常见的分布函数伯努利分布函数(Bernoullidistribution):随机变量X只取0和1两个值,并且相应的概率分布为二项分布(Binomialdistribution):重复n次的伯努利试验,每次成功的概率为p,概率分布为泊松分布(Poissondistribution):指某段连续的时间内某件事情发生的次数,概率分布为注:当二项分布的n很大,p很小,二项分布逼近泊松分布。*常见的分布函数正态分布(Normaldistribution)又名高斯分布(Gaussiandistribution):随机变量X的概率密度函数为幂率分布(Power-lawdistribution):是长尾分布,刻画2/8定律——大量的资源、财富掌握在极少数人的手上*常见的分布函数的图像

您可能关注的文档

文档评论(0)

专业写作专家 + 关注
实名认证
服务提供商

人力资源管理师持证人

专注于企业方案、制度、报告、总结、规划编制,PPT制作等

领域认证该用户于2023年09月21日上传了人力资源管理师

1亿VIP精品文档

相关文档