- 1、本文档共50页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * 一个更加形象的图 * * * * * * * * * * * * * * * * * * * * * * 关于引用分析的研究要比链接分析早得多 * * 目录 背景介绍 Google的网页排序 PageRank简化模型 PageRank随机浏览模型 PageRank的计算 PageRank的计算 互联网是一个有向图 每一个网页是图的一个顶点 网页间的每一个超链接是图的一个有向边 用邻接矩阵来表示图,即:定义邻接矩阵为G,若网页j到网页i有超链接,则 ;反之 。 显然,如果网页有N 个,则矩阵为N×N 的0、1方阵。 多个网页相互链接的图对应的邻接矩阵(这里将0,1值用二值图像显示,黑色代表0,白色代表1) PageRank的计算 定义邻接矩阵为G,若网页j到网页i有超链接,则 ;反之, 。 记矩阵G的列和、行和分别是 它们分别给出了页面j的链出链接数目和链入链接数目 PageRank的计算 假设我们在上网的时侯浏览页面并选择下一个页面,这个过程与过去浏览过哪些页面无关,而仅依赖于当前所在的页面,那么这一选择过程可以认为是一个有限状态、离散时间的随机过程,其状态转移规律用Markov链描述。 定义转移概率矩阵 PageRank的计算 根据Markov链的基本性质,对于正则Markov链,存在平稳分布 ,满足 表示在极限状态(转移次数趋于无限)下各网页被访问的概率分布。 定义为网页的PageRank向量, 表示第i个网页的PageRank值 求矩阵A的特征值1对应的特征向量 某7个网页之间的链接关系图 网页链接图的邻接矩阵 0 1 1 0 1 1 0 1 0 1 1 0 0 0 1 0 0 1 1 0 0 1 0 0 0 1 0 0 1 0 0 1 0 1 1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 G = PageRank的计算 0 1 1/2 0 1/4 1/2 0 1/5 0 1/2 1/3 0 0 0 1/5 0 0 1/3 1/4 0 0 1/5 0 0 0 1/4 0 0 1/5 0 0 1/3 0 1/2 1 0 0 0 0 1/4 0 0 1/5 0 0 0 0 0 0 A = 状态转移概率矩阵A PageRank的计算 0.699456533837389 0.382860418521518 0.323958815672054 0.242969111754040 0.412311219946251 0.103077804986563 0.139891306767478
0.303514376996805 0.166134185303514 0.140575079872204 0.105431309904153 0.178913738019169 0.0447284345047923 0.0607028753993610 求矩阵A特征值1对应的特征向量 归一化 7个网页的PageRank值 PageRank结果的评价 将 PageRank 的评价按顺序排列(PageRank小数点3位四舍五入): 页面之间相互关系及状态转移图 PageRank结果的评价 让我们详细地看一下。ID=1 的页面的PageRank 是0.304,占据全体的三分之一,成为了第1位。 特别需要说明的是,起到相当大效果的是从排在第3位的 ID=2 页面中得到了所有的PageRank (0.166) 数。ID=2页面有从3个地方过来的链入链接,而只有面向 ID=1页面的一个链接,因此(面向ID=1页面的)链接就得到ID=2的所有的PageRank数。 不过,就因为ID=1页面是链出链接和链入链接最多的页面,也可以理解它是最受欢迎的页面。 PageRank结果的评价 反过来,最后一名的 ID=6 页面只有 ID=1 的15%的微弱评价。 总之,
您可能关注的文档
- IP通信网剖析.ppt
- PACU护理业务查房的方式剖析.ppt
- 外锁闭装置技术讲座分解.ppt
- PadDesigner(Cadence焊盘制作)剖析.doc
- PADS内电层分割与铺铜剖析.doc
- PADS软件基础与应用实例-元件摆放和布线方法剖析.ppt
- 五年级下_语文园地三(完美版)分解.ppt
- 五年级下册1——4教案分解.doc
- 文化创新的途径10.29分解.ppt
- 2025辽宁省能源控股集团所属抚矿集团招聘76人笔试参考题库附带答案详解.pdf
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
最近下载
- [紧固件标准]JBZQ 4331-2006 六角开槽螺母.pdf VIP
- DMP3200系列保护测控装置使用说明书.pptx VIP
- 学会宽容-主题班会.ppt VIP
- SPC培训教材---完整版-PPT.ppt VIP
- 生物医药生物医药临床监查员岗面试真题题库参考答案和答题要点.docx VIP
- 群塔交叉作业防碰撞应急预案.pdf VIP
- 【地理】2021年高考真题——福建卷(含答案) .pdf VIP
- 化工过程安全管理五要点-陈毅峰-双语版.pdf VIP
- 【《白酒企业员工培训外包管理的案例分析—以迎驾贡酒为例》10000字】 .docx VIP
- YM-WI-SMT-065 A0 松下 NPM-D3 贴片机保养指导书.pdf VIP
文档评论(0)