网络信息检索与利哨用系列讲座之四.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网络信息检索与利哨用系列讲座之四

网络信息检索与利用系列讲座之四 1 Google (www.G) Google是由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月在美国硅谷创建的高科技公司,他们所设计的Google搜索引擎,旨在提供全球最优秀的搜索引擎服务,通过其强大、迅速而方便的搜索引擎,在网上为用户提供准确、详实、符合他们需要的信息。Google自2000年正式开始商业运营以来,目前在全球范围内已拥有了一个正在快速增长的忠实用户群,其中一半以上是国际用户。Google公司不但拥有自身的独立搜索引擎网站,现今的日访问量高达7000万次,还将其搜索引擎技术售卖给世界上许多公司,目前就有包括雅虎、美国在线、网景和中国的网易等知名网站在内的全球150多家公司采用了Google搜索引擎技术。Google非常注重技术创新,98年至今,已经获得30多项业界大奖,如美国《时代》杂志评选的“1999年度十大网络技术”,《个人电脑》杂志授予的“最佳技术奖”,The Net授予的“最佳搜索引擎奖”等等。Google 是由英文单词“googol”变化而来。“googol”是美国数学家 Edward Kasner 的侄子 Milton Sirotta 创造的一个词,表示 1 后边带有 100 个零的数字。Google 使用这个词代表公司想征服网上无穷无尽资料的雄心。 Google支持中文搜索 其中文搜索引擎是收集亚洲网站最多的搜索引擎之一,并成为它藉此拓展全球信息市场的重要基础。虽然Google非中国本土公司,但在国内,使用它的独立搜索引擎的人数正迅猛增长,其搜索引擎技术还受到了中文雅虎、网易等知名门户网站的亲睐,采用了其中文互联网服务。 下图是Google()的主页,它非常简洁,Google标示下面排列了四大功能模块:网站、图像、新闻群组和网页目录服务。主页默认是网站搜索。功能模块以下为检索输入框,可限定所搜索范围为:搜索所有网站、搜索所有中文网页或搜索中文(简体)网页,并提供高级搜索、使用偏好、语言工具三种设定功能。 (1) Google的搜索功能 忽略词 Google 会忽略最常用的词和字符,这些词和字符称为忽略词。Google 自动忽略“http”, “.com”和“的”等字符以及数字和单字,这类字词不仅无助于缩小查询范围,而且会大大降低搜索速度。 使用英文双引号可将这些忽略词强加于搜索项,例如:输入“柳堡的故事”时,加上英文双引号会使“的”强加于搜索项中 ·简繁转换 Google运用智能型汉字简繁自动转换系统,为您找到更多相关信息。 这个系统不是简单的字符变换,而是简体和繁体文本之间的“翻译”转换。例如简体的“计算机”会对应于繁体的“电脑”。当您搜索所有中文网页时,Google会对搜索项进行简繁转换后,同时检索简体和繁体网页。并将搜索结果的标题和摘要转换成和搜索项的同一文本,便您阅读。 ·不支持“通配”检索 为提供最准确的资料,Google 不使用“词干法”,也不支持“通配符”(*) 搜索。也就是说,Google 只搜索与输入的关键词完全一样的字词。例如:搜索“googl”或“googl*”,不会得到类似“googler”或“googlin”的结果。 ·不区分英文字母大小写 Google 搜索不区分英文字母大小写。所有的字母均当做小写处理。例如:搜索“google”、“GOOGLE”或“GoOgLe”,得到的结果都一样。 ·短语搜索 在 Google 中,可以通过添加英文双引号来搜索短语。双引号中的词语(比如“like this”和“伊拉克战争爆发”)在查询到的文档中将作为一个整体出现。这一方法在查找名言警句或专有名词时显得格外有用。一些字符可以作为短语连接符。Google 将“-”、“\”、“.”、“=”和“...”等标点符号识别为短语连接符。 ·高级搜索 在范围较广的查询中添加词语就可以缩小搜索范围。不过对于某些特定要求的搜索,还可以使用Google的高级搜索功能。点击Google主页中的“高级搜索”链接,即可进入“高级搜索”页面。 利用Google的“高级搜索”,可以做到: ·?? 将搜索范围限制在某个特定的网站中 ·?? 排除某个特定网站的网页 ·?? 将搜索限制于某种指定的语言 ·?? 查找链接到某个指定网页的所有网页 ·?? 查找与指定网页相关的网页 (2) Google 的特殊功能 ·查找 PDF 文件 除一般网页外,Google 现在还可以查找 Adobe 的可移植文档格式 (PDF) 文件。虽然 PDF 文件不象 HTML 文件那样多,但这些文件通常会包含一些别处没有的重要资料。 如果某个搜索结果是 PDF 文件而不是网页,只需在搜索关键词后加上 filetype:pdf 就可以,它的标题前面会出

文档评论(0)

132****6080 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档