网站大量收购闲置独家精品文档,联系QQ:2885784924

幂法-上海交通大学数学系.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
乐经良上海交通大学数学科学学院数学实验搜索引擎的网页排名内容提要网页排名的数学原理图与网络回顾线性代数的相关内容某些有关矩阵特征值知识的介绍计算矩阵特征值的幂迭代法中矩阵运算实际问题现今若你打算了解某种信息多半会利用互联网在或百度搜索引擎中输入一些而且这些网址会依照某些次序排列通常是越靠关键词后与此有关的网页地址会很快显示出来前的越重要意味着关注的人越多那么的搜索引擎是如何做到这一点的呢准备知识而数组称为边或连线在数组两个元素有次序时联系用数组表示称为图元素称为顶点非空集合以及其中元素间的图的表

乐经良 上海交通大学数学科学学院 数学实验 搜索引擎的网页排名 内容提要 Google 网页排名的数学原理 图与网络 回顾线性代数的相关内容 某些有关矩阵特征值知识的介绍 计算矩阵特征值的幂迭代法 Matlab 中矩阵运算 实际问题 现今,若你打算了解某种信息,多半会利用 互联网,在Google (或百度)搜索引擎中输入一些 而且这些网址会依照某些次序排列,通常是越靠 关键词后,与此有关的网页地址会很快显示出来, 前的越重要(意味着关注的人越多).那么 google 的搜索引擎是如何做到这一点的呢? 准备知识 而数组称为边(或连线),在数组两个元素有次序时 联系(用数组 表示) 称为图D ,元素称为顶点, 非空集合 以及其中元素间的 图的表示是十分形象的, 则图称为有向图 例1:右图就表示了有4个顶点 6条边的有向图 1 2 3 4 邻接矩阵将有向图 转化为代数形式表示 则称矩阵G ={gij}为邻接矩阵 例1的4个顶点6条连线 的有向图的邻接矩阵为 对于有向图 D ,定义 1 2 3 4 设某个网络包含n 个网页,每个网页用一个 网络与有向图 数字k (1≤k≤n) 标记,则该网络可用一个有向 则表示网页间链接,当有网页j上有连到网页i 图表示,其中每个顶点看成是一个网页,而边 的链接,称网页j为网页i 的导入链接,而称网页i 为网页j 的导出链接 例1的有向图可表示含4个网页的小网络,网 页1、4各有一个导入链接,2、3各有2个导入链接 1 2 3 4 简化的 PageRank 算法 ? 最简方法 看谁的导入链接更多 1 2 3 4 5 若用正数 xk 表示某网络中第k个网页的重要 性,那么 xixj 表示网页i 比网页j 更重要 例2 导入链接数: x3=3, x2=x4=2, x1=x5=1 问题:1)未考虑导入链接网页的重要性 2) 并列数能否区分(例如2、4) ? 调整 增加考虑网页的质量因素 设网页j 包含nj 个导出链接,则可认为网页j 的重要性被平分赋予其导出链接的网页上,这些 网页均获得重要性数值为 ,记Lk为链接到网页k 的那些网页标记的集合,那么 引进链接矩阵A,其元素 那么记 ,就有 这方程的解就是矩阵A对应于特征根1的特征向量 这意味着我们要求的体现网页重要性的向量 考虑特征向量构成线性空间,规定 x 为矩阵A对应于特征根1的归一化特征向量 注:将邻接矩阵的每列除以该列元素之和就得到A ? 方程有解吗 若一个方阵的所有元素非负,且每列的和均 为1,则该方阵称为列随机矩阵 定理1:列随机矩阵一定存在特征根1 若网络的链接矩阵A是列随机矩阵, 方程可解 例2网络的链接矩 阵A可解此方程 ? 使用Matlab A=[0 0.5 0 0 0;0.5 0 1 0 0;0.5 0 0 0.5 0.5;0 0.5 0 0 0.5;0 0 0 0.5 0]; [V,D]=eig(A); diag(D) 键入 会得到A的特征值(第1个是1). 再键入 abs(V(:,1))/norm(V(:,1),1) 得到对应1的特征向量 ? ? 依然有问题 1)网络的链接矩阵有某列元素全为零 (存在导出链接数为0的网页) 可能特征值中不含1! 1 3 2 4 例3 Matlab 求特征值 A=[0 0 0 0.5;1/3 0 0 0;1/3 0.5 0 0.5;1/3 0.5 0 0]; [V,D]=eig(A); diag(D) 2)依然可能出现无法排名的情况 1 2 3 4 5 例4 A=[0 0 0 0 0;1/2 0 1 0 0;1/2 1 0 0 0;0 0 0 0 1;0 0 0 1 0]; [V,D]=eig(A); diag(D) 利用 Matlab 特征值1对应的归一特征向量(两个),均无法排序 改进的PageRank算法 修改方程为 其中P是加权因子(小于1的正数,常取0.85),这 的赋予,还有一个最低数据(即使无导出链接) 意味着标志网页重要性的数据大部分来自各网页 这样若以S表示所有元素均为 的方阵,依然 要求x是归一化的,则Sx 就是元素均 的列向量 ? 记 M=[pA+(1-p)S], 方程为 x = Mx (*) ? 情况讨论 1) A 是列随机矩阵 易见M也是列随机矩阵,且此时(*)有唯一归 一化解,也就是M的特征根1所对应的特征向量 考虑原来方法未能解决的例4,n =5 取p = 0.85, 利用 M求特征值1和相应特征向量 就可以解决排名问题 p=0.85; A=[0 0 0 0 0;1/2 0 1 0 0;1/2 1 0 0 0;0 0 0 0 1;0 0 0 1 0]; S=ones(5,5)/5; M=p*A+(1-p)

文档评论(0)

zhaohuifei + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档