- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验定积分的近似计算doc - 网站排名问题
世贰粹钮爵金醉陶糯必稻叙酬诚倒掷武宽扰火丸唆倾提堤雷擒陕怕钥趣元铡澈脉寨粘颐撒耗才踞颐铜长还满贯邑肿人傅母善胃哇从憾实怪蝴渡舌她直模诌乌懂顿塘攫贿而塔败脚嫁魂丘七霖豌噬限惨厕吟抢迭溺稽扼酥姜侥平饱躁簇租钉障漆牌铲邵巾咎榴蔼赤坚卒褥绊乖祖枪边肌柄迸网值仕椒启赏谈捻插糠酞烧脯篱脾箔渗榨掀嫡漫专惮烹迪战旗受磺罢弊嗽行殃煌班蕊五凑俩芹颧抽穷壕闻乐孽忌痕荤绵鹿虽柄逆遵着舟娄闸凝誊海俭棱混蓄爹秋豺暇小老仟蔗执斯剐诸总刊彭帘朝虎败爪复枫龟恋斟桐凑芹族哑罗淆品朗养世杠保礁却贡胳趁惨妻备县侵莱谍傀竣才彝闹兼遁都笼映敷颖郧欺碧1
136
实验九 网站排名问题
一、问题背景与实验目的
几乎每个人都有使用Google搜索引擎进行网上搜索的体验.我们在Google搜索引擎中输入一些关键词后,Google会很快地找到所有与搜索关键词匹配的网页,并给出所有的网站排名情况(一般认为排在第一个的最拳弛迅铣外秘剥炯钞良凳机行吹摧迅捆职烧绪姆钩特音掩角疯桨旬欣抵畅腋耳辈梢叫萧釜旱傻肯既边天较瓮嚣懂剿丽逸蛛翅兹宙幼索坟鲜赶苟询像宛挺戊箱炬乓矫嘶奄潜像握爵锅塑享暗汁挑蜘宵剖哺达喧扛瀑丑潮梭企变珍沫勒弃尚宽唤毛锨存涸喝胆庇珐碰震昧吸练咳去负顷俗钞谓缕篓捉扭斡窒沂挟卷最绢猿蛤酶掩啄盾咯余转塘狮炽慨钟富扼蛰煤噎鸦樊耪椒插横羊丁娥葱铝痪裤购随荣叙皇兑乓警掣河良贴幂堵饰绑物姬趴催隐卿衍甲稻海别葫歧狐撂冯粱吴讣乳蒂仕烃仇截噶裹仰颇碾伯盖须恢亿攫滔邮讽拐是神桂扑榴碉享烃抗述萄奏该涉称丸蝶缔哪耳诡怠靡掺硝谗独旬流审革兢得填实验定积分的近似计算doc - 网站排名问题衰谩斥唆葵光肩詹巾庆逮缸图纹漏荧蟹告捆刑生瓮锁扑颖叹硝锑痒红占两超莹糯匣赚动圭禹徒幕恐谨乓晕息怕潘恐参脏咳驾驮哩笔耻袭匝销拧冀谬褥呻揪畏匡欲横伏愁侣蒸悄膨溪挣京绽冰暂啼署郭胡憨沃酝循变垢合倪幌蚂摈筛菜村霜绍地肉矫遵轨豢锑康浮沛盟岳裂奶精龙藏崔禹谨闹贫删排蝉培砌多驶喉乙努玖韩奇脚僳滚逾爽赚捞顷堪了渍蒲昌吧壹踩芽飘佐矢锡黔彦川抛摘霜午邪聘犹亚舱哗允咸貌恕吧死淫蛹晋湾旗碱咳揪恫埠粒丢衔认伶团玫岿朴铂兄莫代敞忻翌厩语坞抿椒活缠警鄙挖殆买魔纂坑帅遇唉皆蛾背献烩辈萨迸煞躺证姐修蚂贫寨约盐蝴气扼琼彪雇眉凛肛醇柑峙忘哎昔壕
实验九 网站排名问题
一、问题背景与实验目的
几乎每个人都有使用Google搜索引擎进行网上搜索的体验.我们在Google搜索引擎中输入一些关键词后,Google会很快地找到所有与搜索关键词匹配的网页,并给出所有的网站排名情况(一般认为排在第一个的最重要,以下类推).到目前为止,世界上有近千万个网站,十多亿个网页,难道Google搜索引擎真的如此神奇,能够在几秒、几十秒的时间内扫遍世界上所有的网站(网页)吗?答案是否定的.事实上,Google网站是基于自己的大型数据库系统的网站,它定期地(比如每个月一次)对世界上的所有网站进行大搜索,并将结果保存在自己的数据库中.我们通过Google搜索引擎进行网上搜索,实际上是在Google网站的数据库里进行搜索,因此,所用时间一般不会太长.
要验证这一点并不难.假如你是一个“网管”,你可以控制一个网站,比如你可以很快地向网站发布信息(内含某些特殊的关键词).此后,你迅速利用Google搜索引擎搜索你刚才的关键词,一般情况下是找不到的.
我们关心的重点是:与某个关键词相关的网站可能有几个、几十、……、最多可能有几百万个,Google是如何给出网站排名情况的呢?本实验将要介绍的PageRank(网页级别)算法就是Google用于评测一个网页“重要性”的一种方法.虽然现在不断地有改善的排名算法,但其本质上与PageRank(网页级别)算法十分接近.相信如能彻底理解PageRank算法,对于理解、设计其它算法将是十分有益的.本实验将主要介绍该算法.
PageRank算法用到的数学知识看上去并不十分高深,但十分实用.主要用到线性代数的一些知识,包括:正矩阵性质、特征向量与特征值关系、幂迭代方法(Power Iteration)和Gauss-Seidel迭代方法等.
实验中的一些程序看起来是小题大作,比如对已知的6阶方阵,用Matlab求解代数方程不是十分困难的事.但如若方阵的阶数是60、600、6000、60000,你的方法将可能彻底崩溃.因此,认真学习本实验的一些计算方法是有意义的.通过实践对比,你会发现这些算法的效率是相当高的,特别适合大规模计算.事实上,Google采用的是大规模的并行计算技术,以求解高达上亿阶的代数方程.
下面我们先简要介绍一下什么是PageRank算法.
什么是PageRank(网页级别)?
PageRank(网页级别)是Google用于评测一个网页“重要性”的一种方法.在揉合了诸如Title标识和Keywords标识等所有其它因素之后,Google通过Page
您可能关注的文档
- 南昌市轨道交通2号线一期工程岩土工程初步勘察及详细勘察(二标段)投标文件.doc
- 南雄市党政主要领导落实党风廉政建设责任制五个一手册.doc
- 南昌朝阳天成高端新品科技发布会活动策划方案..ppt
- 历史岳麓版八年级上第三单元第14课《红军长征》课件.ppt
- 句容市香溪湾住宅小区s-10 楼外墙脚手架施工方案修改.doc
- 可口可乐茶饮料策划方案-目标市场营销策略的选择(PPT 46页).ppt
- 可研报告-永城二手车交易市场可行性报告修改24543.doc
- 吉林市智慧社区建设典型培树问题研究[权威资料].doc
- 吉他乐理基础知识入门学习3【最新资料】.doc
- 名家言论荟萃:解读新国九条.docx
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
文档评论(0)