第三讲 搜索引擎1_图文.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
支持多达132种语言 提供80亿个搜索网页,涵盖内容齐全 搜索速度快 结果命中率高 搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介 智能化的“手气不错”功能,提供可能最符合要求的网页 “网页快照”功能,能从Google服务器里直接取出缓存的网页 特点 Google 使用一组独特的高级硬件和软件,核心软件称为 PageRank。 作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。从网页 A 链接到网页 B 时,Google 就认为“网页 A 投了网页 B 一票”。Google 根据网页的得票数评定其重要性。除了考虑网页得票数(即链接)的纯数量之外,Google 还要分析投票的网页,“重要”的网页所投出的票就会有更高的权重。获得PageRank较高的网页,会显示在搜索结果的顶部。 技术 基本检索:(布尔检索功能) 逻辑“与”:检索框中的两个关键词之间用空格隔开则默认为是“AND”(“与”运算)连接 逻辑“非”:用“—”(减号)表示,同时要求在减号前保留一个空格 逻辑“或”:用“|”表示 /q.htm#q=id=1157type=21ie=utf-8 检索功能 Google不区分英文字母的大小写,所有字母均作小写对待。例如:输入“george washington”(乔治·华盛顿),或是“George Washington”, 再或是“gEoRgE wAsHiNgToN”,结果都是一样的 通配符问题。 “*”代替未知字、词,如“以*治国” 搜索引擎忽略的字符与强制检索。搜索字词会忽略标点符号,其中包括 @#%^*()=[]\ 和其他特殊字符。Google对一些出现频率极高的英文单词,如“i”、“com”、“www”等,作忽略处理。 如果检索词中包含这些字符,必须进行强制检索,在这些字符前后用“+”,如“+www+的历史”,或用英文的引号“ www的历史” 使用GOOGLE应注意的问题 Google自动过滤掉检索词中常用的副词、代词等(比如“的、了、吗” ) Google对检索词的位置和顺序敏感。如你检索“神舟飞船 杨立伟”,它会优先返回“神舟飞船”在前,“杨立伟”在后的记录 [伊拉克 +萨达姆] 和 [伊拉克 萨达姆] 的检索结果一样; [伊拉克 -萨达姆] 检索有“伊拉克”而没有“萨达姆”的资料; [伊拉克*萨达姆] 检索以“伊拉克”开头,“萨达姆”接尾的短语,如“伊拉克总统萨达姆、伊拉克独裁者萨达姆…”; 在字词前后分别加上中文或英文双引号(如“[任意字词]”),可精确搜索字序相同的词组。如检索“top gun” (一部美国电影)的名字,而不是分别检索top 和 gun; [~电脑] 可以进行同义词或近义词检索,即可同时检索包含“电脑”或“计算机”的记录。 常用技巧 百度 李彦宏 徐勇 百度,2000年1月创立于北京中关村,是全球最大的中文搜索引擎。 2000年1月1日,公司创始人李彦宏、徐勇携120万美元风险投资,从美国硅谷回国,创建了百度公司。 2000年5月,百度首次为门户网站——硅谷动力提供搜索技术服务,之后迅速占领中国搜索引擎市场,成为最主要的搜索技术提供商。 2001年8月,发布B搜索引擎Beta版,从后台服务转向独立提供搜索服务,2001年10月22日正式发布Baidu搜索引擎。 2005年8月5日,百度在美国纳斯达克上市。 概况 “百度”二字取自辛弃疾的《青玉案》 “众里寻她千百度” ,象征着百度对中文信息检索技术的执著追求。 现在百度已成为世界上最大的中文搜索引擎,用户能够访问超过10亿的中文网页。 概况 概况 搜索引擎的基础知识 常用搜索引擎 常用的搜索引擎检索技巧 主要内容 很多有价值的资料,在互联网上并非以普通的网页形式出现,而是以Word、Excel、PowerPoint、PDF等文档格式存在。 Filetype:用来限定命中文件的类型。 命令格式: 关键词 Filetype:文件类型 例:文献检索 Filetype:PPT ,表示在网页中搜索包含“文献检索”内容的PPT文件. 专业文档搜索 把搜索范围限定在网页标题中——intitle 标题通常是对网页内容提纲挈领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。 在标题中搜索 把搜索范围限定在特定站点中——site 有时候,您如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”。 注意,“site:”后面跟的站点域名,不要带“http://”;“site:”和站点名之间,不要带空格。 在特定站点中搜索 把搜索范围限定在url链接中——inurl 网页url中

文档评论(0)

colindocx + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档