- 21
- 0
- 约3.43万字
- 约 38页
- 2015-10-20 发布于贵州
- 举报
万维网搜索法的研究——从pagerank算法到weightedindegree算法
中文摘要
PageRallk算法是目前被广泛应用的一种度量网页重要性的方法,它根据网页
之间的链接结构来给每个网页打分。从数学的角度来解释,PageRank可以被看作
是一个马尔可夫随机游走模型,依据网页下一步的链接信息计算两页的转移概率。
用马氏链的平稳分布作为最终的Rank值给网页排序。
受计算机象棋对弈算法设计中,一个很成功的策略“多看几步”的启发,我
网页的转移概率时利用了网页N步的链接信息。特别地,我们假定,如果网上冲
浪者知道每个网页的N步内的链接情况,那么在选择下一步要浏览的网页时他/她
就可做出更好的选择。经典PageRank算法是N.stepPageRank算法N=I时的特殊
情形。TREC标准数据集上的实验表明,N.stepPageRank算法能够有效提高网页
搜索的精确度,MAP指标比经典的PageRank的提高超过15%.
经典PageRank算法和N-stepPageRank算法都是利用平稳分布来度量网页的
重要性。由于计算平稳分布实际上是计算矩阵的特征向量,计算复杂度很高,在
万维网搜索时海量数据信息使得计算的时间开销很大。为了降低计算的复杂度,
我们提出了一种更为简单有效的链接分析方法——wd曲tedInde伊ee算法,与
PageRan
您可能关注的文档
最近下载
- 卢瑟福EMFM KFD9000电磁流量计.docx VIP
- 2025上半年初级软件水平考试《信息系统运行管理员(基础知识)》真题卷(附详细解析).docx VIP
- 鲁奇 煤制甲醇流程图.pdf VIP
- 在全区“高效办成一件事”工作推进会上的讲话.docx VIP
- 2026事业单位工勤技能-北京-北京政务服务办事员三级(高级工)历年参考题库含答案详解5卷试题.docx VIP
- 2024年云南省考评员培训考试题库及答案.docx VIP
- 脓毒血症护理疑难病例讨论.pptx VIP
- 42、2024年路基工程劳务投标报价.xlsx VIP
- 年产5万吨硫膏制取硫磺可研报告.pptx VIP
- 电路与模拟电子技术期末试卷.doc VIP
原创力文档

文档评论(0)