网站大量收购闲置独家精品文档,联系QQ:2885784924

网页PageRank算法分析及主题相关性的改进策略.pdf

网页PageRank算法分析及主题相关性的改进策略.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DOI:10 3969/j.issn.1001-8972.2010.22.041 秽湖臻鋈。;=蕤鍪黪麟纛蘩巍 及主题相关性的改进策略 姜博北方工业大学信息工程学院1OOl44 辩壤豢慧麓溺鬻辫麓灏溺黼奠! 击中,前5页的点击占总点击数的75%。j 分析了基于链接结构Page]≈a,nk.算法,考{ 如何将最权威、和查询最相关的网页排 除了考虑网页被链接的纯数量之外,还考 虑算法在冈页排序方面酶客观优点的同 在搜索结果的最前列,是网页排序算法 虑到网页的所有链入网页对它的推荐能力 时,指出T其在判定穰页主题相关性方面}要解决的问题。 的不足,提出了基圣圭题预测霸瓷度加粳 PageRank算法是在1998年由斯坦福 值越高,则它对其链出网页的推荐能力 的改进策略,为提高爱巍信感摹壤的谁磕 大学的SergeyBrin$ⅡLarryPage提出来就越大;一个网页的链出网页越少,那 率和召回率提供了理谣依据0。 的…,是商业搜索引擎Google采用的链接i 瀵鞘麟鬻麓鬻鬻粼熬懑麟鬻麟 分析排序算法。它的基本思想来自传统文 么它对其中一个链出网页的推荐程度就越 高。据此计算出每个网页的重要性综合 PageI琵nk;相关性;策略 j『“ 献计量学中的文献引文分析,即一篇文献; 指标,即网页级别。重要的、高质量的 灏黼黼糕懑懑鬻黼簇辫鬻瀚鬻j 的质量和重要性可以通过其它文献对其引J 网页可获得较高的网页级别,从而在搜 the meritsof jn Consideringobjective algorithm用的数量来衡量,被引用的次数越多,文} 索结果中获得靠前的排位。 terms ofwebpageranki噜,meanwNe.thisD氆第r 献质量就越高;在这样一个假设基础之 假设某网页A的链入网页数量为11, the based013 analyzesPageEankalgorithinl l嗽 上,一个网页的质量和重要性也可以通过 山 . outjtsinsufficiencyof融t刚豫啦ng 则网页A的权值为:PR(A)=∑器(1) stIt【lcttce,points 其它网页对其超文本链接的数量来衡量。 i=l wevagesub瓣t proposesiml)rovement relevance,and 通过揭示网页之间的引用关系(链接关系), 其中,A为某待评价网页,T1, basedOff strate{}ies subjectpredictionrelevancy 可以衡量出一个网页在网络上的重要水, T2,…,Ti,…Tn表示A的链入网页, orderto theoreticalbasisto weightI唱,in provide 平。直白地说,如果指向A的网页数为100, rateandrecallrateofthe improveaccuracy 而指向B的网页数只有10,则网页A比网 flirectio】_)aJinformation acquisition, 页B更加重要。 PageRank值。 黼辎獭黼瀚麟鬻瓣翳溺麓瀚瓣黧l 式(1)可以用网页的随机漫游模型进行 PageRank;relewncy;strategy 描述。用户根据当前网页的链接等概率访 1、PageRank算法分析

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档