万维网搜索法的研究——从pagerank算法到weightedindegree算法.pdfVIP

  • 21
  • 0
  • 约3.43万字
  • 约 38页
  • 2015-10-20 发布于贵州
  • 举报

万维网搜索法的研究——从pagerank算法到weightedindegree算法.pdf

万维网搜索法的研究——从pagerank算法到weightedindegree算法

中文摘要 PageRallk算法是目前被广泛应用的一种度量网页重要性的方法,它根据网页 之间的链接结构来给每个网页打分。从数学的角度来解释,PageRank可以被看作 是一个马尔可夫随机游走模型,依据网页下一步的链接信息计算两页的转移概率。 用马氏链的平稳分布作为最终的Rank值给网页排序。 受计算机象棋对弈算法设计中,一个很成功的策略“多看几步”的启发,我 网页的转移概率时利用了网页N步的链接信息。特别地,我们假定,如果网上冲 浪者知道每个网页的N步内的链接情况,那么在选择下一步要浏览的网页时他/她 就可做出更好的选择。经典PageRank算法是N.stepPageRank算法N=I时的特殊 情形。TREC标准数据集上的实验表明,N.stepPageRank算法能够有效提高网页 搜索的精确度,MAP指标比经典的PageRank的提高超过15%. 经典PageRank算法和N-stepPageRank算法都是利用平稳分布来度量网页的 重要性。由于计算平稳分布实际上是计算矩阵的特征向量,计算复杂度很高,在 万维网搜索时海量数据信息使得计算的时间开销很大。为了降低计算的复杂度, 我们提出了一种更为简单有效的链接分析方法——wd曲tedInde伊ee算法,与 PageRan

文档评论(0)

1亿VIP精品文档

相关文档