图上对象相似度计算的研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 要 最近,对图上的对象进行分析,尤其是对图上结点之间的相似度进行衡量, 吸引了学术界的众多目光。基于随机冲浪者对模型的 SimRank 相似度是其中一 种比较简单和有影响的相似度衡量。然而现有的 SimRank 计算方法却面临着两 方面的问题:一是当图的规模变大时,计算的代价十分巨大;二是只能应用于 静态的图,当图发生更新时需要进行重新计算。本文针对这两方面的问题提出 了解决方法。首先,对大规模的图,我们对图上的结点进行划分,根据这个划 分把图的邻接矩阵和 SimRank 矩阵划分成众多子矩阵,从而提出解决大规模图 上进行 SimRank 计算的基本框架 B-SimRank 方法。然后,我们通过向量化和克 罗内克积把 SimRank 计算转换成一阶马克科夫链计算,并利用 IA-SimRank (Iterative Aggregation )方法对每个 SimRank 子矩阵进行局部迭代,从而加快 SimRank 的收敛速度而不降低 SimRank 的精确度。在IA-SimRank 方法和 B-SimRank 方法的基础上,我们提出 IAU-SimRank 方法处理 SimRank 的增量计 算问题,IAU-SimRank 方法中部分 SimRank 子矩阵需要进行局部迭代,其它 SimRank 子矩阵则在更新前的 SimRank 值上进行调整。最后,我们利用 GPU 对 SimRank 计算进行并行化,并通过压缩数据和减少数据传输等方法降低显存/ 内 存数据传输瓶颈对 GPU 算法的影响。通过实验和分析,我们验证了所提出方法 的高效性和有效性。 关键字:SimRank 相似度,IA 迭代聚集,GPU 并行计算 1 Abstract Recently, there have been a lot of interests in graph-based analysis. One of the most important aspects of graph-based analysis is to measure similarity between nodes in a graph. SimRank is a simple and influential measure of these measures, based on a solid random surfer-pairs model. However, existing methods on SimRank computation suffer from two limitations: (1) the computing cost can be very high in practice, especially when the graphs become large; and (2) they can only be applied on static graphs, when the graphs evolving and growing overtime, the SimRank matrix should be recomputed. In this paper, we try to solve these problems. First, we propose a framework to handle SimRank computing problem on large graphs, B-SimRank. The B-SimRank method partitions the adjacency matrix and SimRank matrix into small sub-matrices. Futhermore, based on the observation that SimRank can be rewrited into a first-order Markov chain by vectorization and Kronecker product, we propose to utilize the iterative aggregation techniques for uncoupling Markov chains to c

文档评论(0)

文献大师 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档