- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
搜索引擎基本知识汇
公欲善其事,必先利其器 公欲善其事,必先利其器 搜索引擎基本知识 2006年度时代周刊封面人物? 2.搜索引擎的基本知识 2.1 概念 2.2 工作原理 2.3 分类 2.4 历史 工欲善其事,必先利其器 2.搜索引擎的基本知识 2.1 概念 伴随Web而出现的检索网上信息资源 的新工具。 是一种网页网址检索系统,有的提供分 类和关键词检索途径,有的仅提供关键词检 索途径。有些还提供引文检索途径。 实质上是互联网上专门提供查询服务的 一类网站。 2.搜索引擎的基本知识 2.2 工作原理: 搜索引擎并不直接搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 搜索引擎,也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。 2.2 工作原理 2.2 工作原理 至少由三部分组成: 爬行器(机器人、蜘蛛) 索引生成器 查询检索器 随着搜索引擎的发展,许多搜索引擎在此基础上增加特色功能。如百度增加了监控程序。 2.搜索引擎基本知识 2.3 分类 按工作原理划分: 独立检索工具、 元搜索引擎 2.3 分类 元搜索引擎(集成搜索引擎) 自身不采集信息,没有信息库,同时检索多个独立搜索引擎,以统一格式输出结果。信息量大,用时短。Vivisimo、Ixquick、MetaCrawler、搜星、万纬搜索等。 2.3 分类 按检索内容划分 通用检索工具 是综合性的信息检索系统,它往往基于检索词去匹配相关的内容。时常也会因检出内容太泛而无法一一过目。 如:Google、Altavista、ODP、Yahoo!、百度 专业检索工具 是专业信息机构根据专业需求,将Internet上资源进行筛选整理、重新组织而形成专业信息检索系统,专业针对性较强。 如:Medical Matrix、HealthWeb、BIOMED 2.搜索引擎基本知识 2.4 历史 1994年,由杨致远等研制的Yahoo主题指南,拉开了网络信息检索的序幕。 1997年 第一个中文搜索引擎悠游诞生。 目前因特网上可供检索的搜索引擎数量 不下10,000种。 中国搜索引擎市场调查报告 3.Google (一) 简介 Google源自DLI1(Digital Library Initiative 1)的一个项目。 1994年在读研究生Larry Page和Sergey Brin参与了斯坦福大学主持的Infobus项目,这个项目以解决异构系统互操作为主要目标,他们开发了一项名为“BackRub”的搜索技术,其核心就是Pagerank技术,这就是Google的前身。 1997年他们发表了论文并建立了试验性搜索网站, 次年Google公司宣告正式成立。 当年Altavista,Infoseek,Exite甚至包括Yahoo!(当时Yahoo!搜索引擎还用的是Inktomi)风靡互联网的时候,曾有人宣告搜索引擎技术不可能有什么发展了,已经到头了。 Pagerank:用大量的链接结构为依据为网页计算得分。从本质上来说,一个从A页到B页的链接a,算A投B一票。同时也分析投票网页本身。网页投出的票是否重要取决于该网页本身的权重,如果本身也是很重要的网页,那么它投出的票能帮助其他网页变得“重要”。 PR值的级别从1到10级,10级为满分。PR值越高说明该网页越受欢迎。 (一) 简介 Google的来源 “Googol”是一个数学名词,表示一个 1 后面跟着 100 个零。这个词是由美国数学家 Edward Kasner 的外甥 Milton Sirotta 创造的,随后通过 Kasner 和 James Newman 合著的“Mathematics and the Imagination”(数学与想象力)一书广为流传。Google 使用这一术语体现了公司整合网上海量信息的远大目标。 GOOGLE创办人 Google的简介 搜索的网页:80 亿+;图片:10 亿+ ;Usenet 信息:10 亿+ 拥有100多种界面语言和国际域名 员工数超过5680人,大部分是技术人员和工程师(截止至2005年12月) 在搜索引擎市场占有56%的份额 广告客户数量达数千家 在世界各地拥有20个办事机构 股票面值近300美元,总市值超800亿美元! 2006年4月12日Google将中文名“科高”改为谷歌,意为山谷之歌。 (截止2006年4月)[2] G 是互联网上 5 大最受欢迎的网站之一,在全球范围内拥有无数的用户。 Google 是阿根廷、澳大利亚、比利时、巴西、加拿大、丹麦、法国、德国、印度、意大利、墨西哥、西班牙、瑞典、瑞士、英国和美国的头号
文档评论(0)