互联网Google搜索引擎的PageRank.docVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
互联网Google搜索引擎的PageRank

互联网:Google搜索引擎的PageRank 越来越多的人上网,越来越多的人上网时会使用搜索网站,搜索网站越来越多,哪个搜索网站最好?没有最好,只有更好! Google 使用 PageRank? 技术检查整个网络链接结构,并确定哪些网页重要性最高。然后进行超文本匹配分析,以确定哪些网页与正在执行的特定搜索相关。在综合考虑整体重要性以及与特定查询的相关性之后,Google 可以将最相关最可靠的搜索结果放在首位。 PageRank 技术:通过对由超过 50,000 万个变量和 20 亿个词汇组成的方程进行计算,PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票数量来评估该页的重要性。 PageRank 还会评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。重要网页获得的 PageRank(网页排名)较高,从而显示在搜索结果的顶部。Google 技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有人工干预或操纵,这也是为什么 Google 会成为一个广受用户信赖、不受付费排名影响且公正客观的信息来源。 “从许多优质的网页链接过来的网页, 必定还是优质网页”。 可以在查询PageRank。 您查询的页面地址: 您查询的页面地址: 例如,观察如下的网页链接图。 再例如, 上图对应的网页连接表如下, 反向链接源 结点 正向链接目标 2,3,5,6 1 2,3,4,5,7 1,3,4 2 1 1,4,5 3 1,2 1,5 4 2,3,5 1,4,6,7 5 1,3,4,6 5 6 1,5 1 7 5 可写出如下的邻接矩阵, 将邻接矩阵转置后再按列单位化,即可得到概率转移矩阵 将各个网页的PR记作xi,记x=(x1,x2,x3,x4,x5,x6,x7)T,则应有Mx=x。想一想,为什么? (在此复习特征值和特征向量的定义) 可编写如下的Matlab程序,prog2.m A=[0 1 1 1 1 0 1 1 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 1 0 1 0 0 1 0 1 1 0 1 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0]; M=A; M=M*inv(diag(sum(M))); [V,D]=eig(M); disp(PageRank:); disp(V(:,1)); 计算后可得如下结果: prog2 PageRank: 0.6995 0.3829 0.3240 0.2430 0.4123 0.1031 0.1399 思考:Matlab中eig函数使用的算法在大规模矩阵(100亿阶矩阵)运算时,不可行,如何解决此困难? 办法:可以使用幂法(x(k+1)=Mx(k))求解M的对应于特征值1的特征向量,即PageRank。改写程序如下,prog3.m A=[0 1 1 1 1 0 1 1 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 1 0 1 0 0 1 0 1 1 0 1 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0]; M=A; M=M*inv(diag(sum(M))); x=ones(7,1);x=x/norm(x);n=50; for i=1:n x(:,i+1)=M*x(:,i); end disp(PageRank:); y=x(:,n+1);y=y/norm(y);disp(y); 计算结果与前面程序一致。 (再结合生态学:海龟种群统计数据模型,回答思考题) 参考文献 《Google 的秘密- PageRank 彻底解说 中文版》,/pagerank_cn.htm 《Google 公司信息:技术》,/intl/zh-CN/corporate/tech.html 《网页排名算法及其应用》,徐德志、申红婷,贵州大学学报,2007年9月,第24卷第5期,491~494

文档评论(0)

busuanzi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档