- 1、本文档共69页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
搜索引擎(Search Engine) 2002年,华尔街一位著名的分析师指出:Internet作为一种现象,本质上可以用三个单词来表示:Search、Find、Obtain 竞价排名赢利模式(Overture、百度) Freemium商业模式 ( Wolfram Alpha ) 搜索引擎技术 Page Rank 在互联网上,如果一个网页被很多其它网页所链接,说明它受到普遍的承认和信赖,那么它的排名就高。这就是 Page Rank 的核心思想 当然 Google 的 Page Rank 算法实际上要复杂得多。比如说,对来自不同网页的链接对待不同,本身网页排名高的链接更可靠,于是给这些链接予较大的权重 搜索引擎技术 Page Rank 考虑了这个因素,可是现在问题又来了,计算搜索结果的网页排名过程中需要用到网页本身的排名,这不成了先有鸡还是先有蛋的问题了吗? Google 的两个创始人拉里?佩奇 (Larry Page )和谢尔盖?布林 (Sergey Brin) 把这个问题变成了一个二维矩阵相乘的问题,并且用迭代的方法解决了这个问题。 搜索引擎技术 先假定所有网页的排名是相同的,并且根据这个初始值,算出各个网页的第一次迭代排名,然后再根据第一次迭代排名算出第二次的排名。他们两人从理论上证明了不论初始值如何选取,这种算法都保证了网页排名的估计值能收敛到他们的真实值 值得一提的事,这种算法是完全没有任何人工干预的 搜索引擎技术 理论问题解决了,又遇到实际问题。因为互联网上网页的数量是巨大的,上面提到的二维矩阵从理论上讲有网页数目平方之多个元素。如果我们假定有十亿个网页,那么这个矩阵 就有一百亿亿个元素。这样大的矩阵相乘,计算量是非常大的 拉里和谢尔盖两人利用稀疏矩阵计算的技巧,大大的简化了计算量,并实现了这个网页排名算法。今天 Google 的工程师把这个算法移植到并行的计算机中,进一步缩短了计算时间,使网页更新的周期比以前短了许多 网页搜索(Google) 搜索和指定页面类似的网页 related: 搜索与某个URL地址存在链接的网页 link: 高级搜索 地图搜索(Google) Google 地图是Google提供的服务,为使用者提供强大、使用者友善的地图技术以及本地公司资讯,包括公司位置、联络资讯以及行车路线指示 Google 地图通过很多来源收集信息,从而提供最佳的地图 博客搜索 (Google) “博客搜索”是 Google 搜索技术针对博客内容所提供的服务 “博客搜索”的目标是收录每一个发布了站点种子(以RSS或Atom方式)的博客 “博客搜索”通过站点种子对博客内容进行收录,并及时查看是否有新的内容发布 特色功能(Google) Gmail Google Docs Google Calendar Google Earth Google Talk Picasa YouTube 特色搜索(电影字幕搜索引擎) / 国际电影资料库 / 特色搜索(其他搜索引擎) Flash搜索 论坛搜索 / 视频搜索 搜房引擎 三维地图 学术论坛 学术论坛 学术论坛 / 管理论坛 http://21 学术搜索 ResearchIndex(/cis) INFOMINE(/) EEVL(http://www.eevl.ac.uk/) MathSearch(.au:8000/MathSearch.html) PhysLink(/) 特色搜索(其他搜索引擎) 找人 图书 多媒体 / 地图 /# 五、搜索引擎应用 搜索引擎应用 网页搜索 学术搜索 特色搜索 关键词 网页搜索(Google) Google Inc. 创建于 1998 年 9 月 Google 的使命是整合全球信息,使人人皆可访问并从中受益 Google 是全球最大的搜索引擎 G 是互联网上 5 大最受欢迎的网站之一 网页搜索(Google) 搜索引擎最基本的语法“与”“非”和“或”,这三种搜索语法Google分别用“ ”(空格)、“-”和“OR”表示 通配符问题 关键字的字母大小写 搜索整个短语或者句子 搜索引擎忽略的字符以及强制搜索 网页搜索(Google) 在某一类文件中查找信息 filetype: 对搜索的网站进行限制 site: 搜索的关键字包含在网页标题中 intitle: 搜索的关键字包含在网页内文中 intext: 搜索的关键字包含在URL链接中 inurl: 搜索的关键字包含在锚点标记中 inanchor: 图片搜索(Google) 号称“互联网上最好用的图片搜索工具” 图像搜索的工作原理:Google 分析页面上图像附近的文字、图像标
您可能关注的文档
- 信号与系统§18系统分析方法.ppt
- 2011北京市海淀二模高考理综化学.doc
- 2011会计基础-50分大题总结.doc
- 2011届融水二中文科综合模拟试卷.doc
- 2011届高三政治一轮复习银行和储蓄者.doc
- 信号与系统分析第三章(功率谱和能量谱)(313次).ppt
- 2011山东各地市压轴题.doc
- 2011届高考英语二轮专题复习学案专题1语法和词汇知识之名词冠词和主谓一致.doc
- 2011年03月国二VF全真模拟试题答案详解10.doc
- 2011届高考物理必记知识点和常考知识点十八个大总结.doc
- 湖北省天门市2024-2025学年七月高一期末统一调研测试英语试卷含答案.pdf
- 襄阳市2025年7月高二期末同意调研测试英语试卷含答案.pdf
- 襄阳市2025年7月高一期末统一调研测试历史试卷含答案.pdf
- 四川省资阳市2024-2025学年高二第二学期期末质量监测英语试卷含答案.pdf
- 湖北省黄石市2025年春季学期高一期末统一测试英语试卷含答案.pdf
- 断桥思路400字[8篇].docx
- 落满阳光的回忆初一作文范文700字7篇范文.docx
- 尼尔斯拔鹅毛800字[14篇].docx
- 给交警叔叔的一封信1500字[10篇].docx
- DB13∕T 6133-2025 建筑金属隔震支座应用技术导则.pdf
文档评论(0)