Google搜索引擎的数学模型及其应用.docVIP

  • 36
  • 0
  • 约5.85千字
  • 约 8页
  • 2020-05-17 发布于湖北
  • 举报
第36卷第3期 JoumaI of Southw西est南Un民iv族ers大ity学fo学r N报ati。on自al然itie苎s N学at版ural Science Edition May 201o I . 1‘一……。文章编号:1003-2843(201003-0480--07 Google搜索引擎的数学模型及其应用 赵国,宋建成 (西南民族大学计算机科学与技术学院,四川成都610041 摘要:该文在阐明Google搜索引擎中关键的页面等级算法(PageRallk原理的基础上,分析了PageRank算法的随机冲浪模型,并着重讨论相应的数学模型在足球队排名问题(1993年全国大学生数学建模竞赛B题中的应用.具体做法是综合考虑各队的比赛成绩,为每支球队计算相应的等级分(Rank,然后根据各队的等级分高低来确定名次.考虑到竞技比赛结果的不确定性,最后建立了等级分的随机冲浪模型.分析表明等级分排名结果具有良好的参数稳定性,并且可以成功地处理数据缺损方面的困难. 关键词:搜索引擎;Google PageRank算法;随机冲浪模型;足球队排名问题中图分类号:0141.4 文献标识码:A 1 引言 据统计,在短短20多年的时间里,Intemet中产生的信息量相当于人类过去100年产生的信息总量,而且 Internet上的信息量正以几何级数递增.搜索引擎已经成为人们进行Internet信息资源搜索必不可少的工具.在 众多的搜索引擎中,Google搜索引擎以其雄厚的技术为支撑,凭借其强大的检索功能和高质量的检索服务,逐 渐脱颖而出.Google搜索引擎是由斯坦福大学Sergey Brin和Lawrence Page共同设计的…,它是目前功能最强的搜索引擎.通过对80亿网页进行整理,Google可为世界各地的用户提供所需的搜索结果,而且搜索速度极快, 通常不到半秒,每天可提供约3亿次查询服务. 图1 Google搜索引擎的工作原理示意图 图2Intemet网络的拓扑结构 Google的优势在于掌握的信息量以及检索模型和检索速度.传统的搜索引擎在很大程度上取决于文字在 网页上出现的频率.Google使用PageRank技术检查整个网络链接结构,并确定哪些网页重要性最高.然后进 行超文本匹配分析(HypeneXt Matching Analysis,以确定哪些网页与正在执行的特定搜索相关.在综合考虑整体 收稿日期:2010.03.13 作者简介:赵国(1979.,男,硕士,西南民族大学计算机科学与技术学院讲师,主要研究方向为金融数学、数学模型基金项目:西南民族大学青年项目. 第3期 o 0.25 O.25 o.1 0 0 0.2 O.1 0 O.2 O.2 O.1 0.1 0 0 0 0 赵国等:Google搜索引擎的数学模型及其应用 O.5 0 0 0.5 0 0 O 0 0 0 0 0 o 0.4 0.2 0 0 0 0 0 0.2 0.2 0 0 o 0.3333 0 0 0 0 0 0 0 0 0 o 0 0 0 0 0 0 0 0 0 0 o 0.5 0 0 0 0 0 o 0.4 0 0 0 0 0.2 o 0.3333 0 0.3333 0 0 0 0 0 0.3333 0 0 o.2857 0.1429 0 0.1429 0 0 0.1429 0.1429 0.1429 0 0 0 0 0 0 0 0 0 0 0 0 0 0 l 0 0 0 0 0.4 0 0 0.2 0 0 0.4 O 485 P== 0 O 0 O 0 0 0.5 0.25 0 0 0 0.25 0.2 0 0 0 0.2 0.6667 0 根据常识,在一场比赛中平局出现的概率为三.同时,考虑到通常平局与获胜局的得分比为1:3,我们可以 对平局和获胜局的转移概率矩阵进行加权处理,得到下面的加权权重矩阵 ’ ^ 形=二×1×P+二×3×S= 3 0 0.4833 0.4833 O 3 0.5333 0 l 0.5 0.5 0.4 0.6667 0 0.25 O.5 0.0952 0 0 0 0 0.3333 O 0.3 0.1l 11 0.6667 0.6667 0.1667 0.1333 0.36ll 0.0476 2 0.25 O O 0.2333 0.4 0.25 0.3333 0.06670.1667 0 0.1667 O.1667 0 0 0.4 0 0 0 0 0 0 0 0 0.25 0 0 0.5667 0 0.5 0.3167 0 0.11ll 0.0476 0 0 0.75 0.25 0 0.3333 0 O 0.1333 O O O O.8 0.0333 O 0 O 0 0 0 0 0.0833 0 0.0667 0.3333 0

文档评论(0)

1亿VIP精品文档

相关文档