- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
链路预测的方法汇总基于共同邻居的相似性指标共同邻居数(CN:commonneighbors):如果两个人有很多的共同朋友,那么这两个人成为朋友的可能性就比较大。分别表示节点x和y的邻居链路预测的相似性指标AA(Adamic-Adar)指标:基本思想是度小的共同邻居节点的贡献要大于度大的共同邻居节点。AA相似性指标资源分配指标(ResourceAllocation,RA):节点x可以通过共同邻居传递一些资源给节点y,且每个共同都有一个单位的资源平均分配给它的邻居。RA和AA指标的最大区别在于赋予共同邻居的权重的方式不同,当网络平均度比较小的时候,两个指标差别不大,但对于平均度比较大的网络,就有很大的区别。RA相似性指标LP(localpath)指标:稀疏网络很多节点之间的共同邻居数很少,甚至没有,因此不仅仅需要考虑2阶路径,还要考虑3阶路径其中1是可调参数,(A3)xy表示节点x与y之间路径长度为3的数量。=0时,LP变为CN指标。推广到n阶路径的情况:局部路径相似性指标Katz指标:考虑了网络的所有路径,定义为:其中α1是可调参数,(An)xy表示节点x与y之间路径长度为n的数量;表示节点x与y的路径长度为l的数量。如果参数α小于邻接矩阵A的最大特征值的倒数,则上述可以写成:Katz相似性指标由Leicht,Holme和Newman提出,相似矩阵为:M表示网络的连边数;λ1表示邻接矩阵A的最大特征值;D为度矩阵,即对角矩阵,第i个对角元为节点i的度ki;为可调参数。LHN-II相似性指标补充材料——矩阵的奇异值分解矩阵的奇异值分解例题矩阵的伪逆D+:当D中的元素为0是,对应的元素也为0,如对应的元素不为0,则D+中元素是D中对应元素的倒数。基于平均通勤时间(averagecommutetime,ACT)的相似性指标:m(x,y)为一个随机游走粒子从节点x到节点y平均需要的步数,那么节点x和节点y的评价通勤时间定义为:n(x,y)可以通过网络拉普拉斯矩阵L(L=A-D)的伪逆求得,即其中lxy表示矩阵中第x行第y列对应的元素。两个节点越相似,节点间的通勤时间应该越小,忽略常数项M,故有基于随机游走的相似性指标基于随机游走的相似性指标基于网络拉普拉斯矩阵伪逆的Cosine指标SimRank:如果两个节点所连接的节点相似,那么这两个节点就相似其中为衰减因子。有重启的随机游走指标带重启的随机游走(Randomwalkwithrestart,RWR):随机游走粒子每一步会以概率1-c返回到出发点,以概率c随机走到一个邻居节点(pagerank)。:马尔科夫概率转移矩阵,元素表示节点x的粒子下一个时刻到达节点j的概率。:一维列向量,其中第x个元素为1,其他均为0.稳态解为:由此定义RWR相似性指标:局部随机游走指标局部随机游走(Localrandomwalk,LWR):一个粒子时刻从节点x出发,那么得到如下演化方程:表示节点x的粒子下一个时刻到达节点j的概率,设各个节点的初始资源分布为,则基于t步随机游走的相似性指标:推广:有叠加效应的局部随机游走指标(Superposedrandomwalk,SRW)加权网络的链路预测含权的CN指标含权的AA指标含权的RA指标:加权网络的链路预测(续)CN指标(L=2),LP指标(L=3),Katz指标和LHN-II指标(L=)可以写成如下统一形式。因此基于路径的含权相似性,可以用含权形式的邻接矩阵W代替(这种方法多适用于节点间存在多条边,比如两个科学家合作多篇论文。)随机游走的含权相似性:弱连接强效应人与人之间的关系,从沟通互动的频率来看,可以简单划分为强连接和弱连接。强连接(StrongTies):有较多的沟通或互动机会。弱连接(WeakTies):沟通和互动机会较少。弱连接强效应(thestrengthofweakties):找工作的人更多的是通过那些很少见面甚至一年才可能见一次面的人那里获得职位的信
您可能关注的文档
- 大学课程《社交大数据分析方法与应用》PPT课件:02-社交网络背景与描述性指标.ppt
- 大学课程《社交大数据分析方法与应用》PPT课件:03-基本网络模型.ppt
- 大学课程《社交大数据分析方法与应用》PPT课件:04-社交网络的关键点识别.ppt
- 大学课程《机器学习与经济学实证应用》PPT课件:第2讲_线性回归与惩罚回归.pptx
- 大学课程《机器学习与经济学实证应用》PPT课件:第4讲_自然语言处理入门.pptx
- 大学课程《机器学习与经济学实证应用》PPT课件:第5讲_集成算法.pptx
- 大学课程《电气工程CAD》PPT课件:第4章AutoCAD图形注释.pptx
- 大学课程《电气工程CAD》PPT课件:第6章自定义工作环境.pptx
- 科技预见与未来愿景2049.pdf
- 2025年品牌出海手册2.0.pdf
原创力文档


文档评论(0)