网站大量收购独家精品文档,联系QQ:2885784924

pagerank算法讲解讲诉.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 一个更加形象的图 * * * * * * * * * * * * * * * * * * * * * * 关于引用分析的研究要比链接分析早得多 * * 目录 背景介绍 Google的网页排序 PageRank简化模型 PageRank随机浏览模型 PageRank的计算 PageRank的计算 互联网是一个有向图 每一个网页是图的一个顶点 网页间的每一个超链接是图的一个有向边 用邻接矩阵来表示图,即:定义邻接矩阵为G,若网页j到网页i有超链接,则 ;反之 。 显然,如果网页有N 个,则矩阵为N×N 的0、1方阵。 多个网页相互链接的图对应的邻接矩阵(这里将0,1值用二值图像显示,黑色代表0,白色代表1) PageRank的计算 定义邻接矩阵为G,若网页j到网页i有超链接,则 ;反之, 。 记矩阵G的列和、行和分别是 它们分别给出了页面j的链出链接数目和链入链接数目 PageRank的计算 假设我们在上网的时侯浏览页面并选择下一个页面,这个过程与过去浏览过哪些页面无关,而仅依赖于当前所在的页面,那么这一选择过程可以认为是一个有限状态、离散时间的随机过程,其状态转移规律用Markov链描述。 定义转移概率矩阵 PageRank的计算 根据Markov链的基本性质,对于正则Markov链,存在平稳分布 ,满足 表示在极限状态(转移次数趋于无限)下各网页被访问的概率分布。 定义为网页的PageRank向量, 表示第i个网页的PageRank值 求矩阵A的特征值1对应的特征向量 某7个网页之间的链接关系图 网页链接图的邻接矩阵 0 1 1 0 1 1 0 1 0 1 1 0 0 0 1 0 0 1 1 0 0 1 0 0 0 1 0 0 1 0 0 1 0 1 1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 G = PageRank的计算 0 1 1/2 0 1/4 1/2 0 1/5 0 1/2 1/3 0 0 0 1/5 0 0 1/3 1/4 0 0 1/5 0 0 0 1/4 0 0 1/5 0 0 1/3 0 1/2 1 0 0 0 0 1/4 0 0 1/5 0 0 0 0 0 0 A = 状态转移概率矩阵A PageRank的计算 0.699456533837389 0.382860418521518 0.323958815672054 0.242969111754040 0.412311219946251 0.103077804986563 0.139891306767478 0.303514376996805 0.166134185303514 0.140575079872204 0.105431309904153 0.178913738019169 0.0447284345047923 0.0607028753993610 求矩阵A特征值1对应的特征向量 归一化 7个网页的PageRank值 PageRank结果的评价 将 PageRank 的评价按顺序排列(PageRank小数点3位四舍五入): 页面之间相互关系及状态转移图 PageRank结果的评价 让我们详细地看一下。ID=1 的页面的PageRank 是0.304,占据全体的三分之一,成为了第1位。 特别需要说明的是,起到相当大效果的是从排在第3位的 ID=2 页面中得到了所有的PageRank (0.166) 数。ID=2页面有从3个地方过来的链入链接,而只有面向 ID=1页面的一个链接,因此(面向ID=1页面的)链接就得到ID=2的所有的PageRank数。 不过,就因为ID=1页面是链出链接和链入链接最多的页面,也可以理解它是最受欢迎的页面。 PageRank结果的评价 反过来,最后一名的 ID=6 页面只有 ID=1 的15%的微弱评价。 总之,

文档评论(0)

4477704 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档