Chapter+7+链接教案解析.ppt

Chapter 7 链接分析 陈珂锐 chenke0616@163.com 计算机与信息工程学院 目录 1. 随机游走模型(Random Surfer Model) 2. 子集传播模型 3. 链接分析算法之间的关系 4. PageRank算法 5. HITS算法 6. SALSA算法 7. 主题敏感PageRank 8. Hilltop算法 9. 其他改进算法 1 随机游走模型(1) 随机游走模型针对浏览网页的用户行为建立的抽象概念模型 很多链接分析算法都建立在随机游走模型基础之上 用户打开浏览器第1个网页,假设用一虚拟时钟及时,此时可以设定时间为1,用户点击了页面中的某个链接,进入第2个页面,此时虚拟时钟为2,如果网页包含k个出链,则用户从当前页面跳转到任意一个链接的概率是相等的。 在浏览器中输入网址,直接到达某网页,这个行为称为远程跳转 假设互联网中共有m个页面,则用户跳转到任意一个页面的概率是相等的,即为1/m 1 随机游走模型(2) 2. 子集传播模型(1) 其基本思想是在算法设计时,把互联网网页按照一定规则划分,分为两个甚至是多个子集合。其中某个子集合具有特殊性质,许多算法从这个具有特殊性质的子集合出发,给予子集合内网页初始权值,之后根据这个特殊子集合内网页和其他网页的链接关系,按照一定方式将权值传递到其他网页。 2. 子集传播模型(2) 诸多算法的区别: 如何定

文档评论(0)

1亿VIP精品文档

相关文档