网站大量收购独家精品文档,联系QQ:2885784924

因特网信息资源检索.pptVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

10因特网信息资源检索10.1搜索引擎10.2常用中文搜索引擎的使用10.3常用中英文目录型网络检索工具10.1搜索引擎搜索引擎的定义01搜索引擎(SearchEngine)是指对因特网各种信息资源进行标引和检索的工具。02搜索引擎使用自动搜索软件来采集、发现、收集并标引网页、建立数据库,以WWW页形式提供给用户一个检索界面,供用户通过关键词、词组或短语等检索项来进行检索。03人工采集:由专门的信息人员跟踪和选择有用的WWW站点或页面,并按规范方式分类标引并组建成索引数据库。01自动采集:是通过自动索引软件(Spider、Robot或Worm)在网络上不断搜索相关网页来建立、维护、更新索引数据库的。自动采集能够搜索、采集和标引网络上众多站点和页面,并根据检索规则和数据类型对数据进行加工处理,因此它收录、加工信息的范围广、速度快,能及时地向用户提供Internet中的新增信息,及其检索提问的所有网址并提供链接点。02信息的采集与存储10.1.2搜索引擎工作原理建立索引数据库信息采集与存储后,搜索引擎要对已收集的信息进行整理,建立索引数据库,并定时更新数据库内容。索引数据库中每一条记录基本对应于一个网页,记录包括关键词、网页摘要、网页URL等信息。检索界面的建立每个搜索引擎都必须提供一个良好的信息查询界面,接收用户在检索界面中提交的搜索请求,搜索引擎根据用户输入的关键词,在索引数据库中查找,把查询命中的结果(均为超文本链接形式)通过检索界面返回给用户,通过搜索引擎提供的链接,即刻访问相关信息。10.1.3搜索引擎的基本检索功能01布尔逻辑检索05自然语言检索04字段检索02词组检索03截词检索06多语种检索07区分大小写检索2常用中文搜索引擎的使用012.1百度中文搜索引擎百度(http://)于1999年底成立于美国硅谷,是由资深信息检索技术专家、超链分析专利的唯一持有人李彦宏及徐勇博士创建的。01百度是世界上最大的中文搜索引擎,支持搜索4亿中文网页,并且每天增加几十万新网页,对重要中文网页实现每天更新,用户通过百度搜索引擎可以搜索到世界上最新最全的中文信息。百度标题下,对新闻搜索、网页搜索等最常用的搜索对象做出了链接,可在特定范围内搜索信息。高级检索2.百度中文搜索引擎的检索语法特点

不支持逻辑运算“AND”、“OR”的使用,用“│”表示逻辑“或”。如用户要查询“足球”或“申花”相关资料,不需要分两次查询,只要输入“足球│申花”。用减号“-”表示逻辑“非”操作,如需查询关于“足球”但不含“意大利”的资料,输入“足球-意大利”即可搜索到相关信息。01用“”表示精确检索(词组短语或句子)02百度对英文字符大小写不敏感,所有的字母均作小写处理。例如:搜索“FOOTBALL”、“football”或“Football”,得到的结果都一样。03百度的高级搜索语法site:表示搜索结果局限于某个具体网站或某域名内的网页。如:网球site:表示在体坛周报网站内搜索和足球相关的资料;足球site:表示在域名以“”结尾的网页内搜索和足球相关的资料。intitle:在标题中搜索。

例如:“intitle:足球”表示搜索标题中含有关键词“足球”的网页;

“intitle:足球中国”表示搜索标题中“足球”和“中国”的网页。2.1Google搜索引擎Google()是目前因特网上最优秀的支持多种语种的搜索引擎之一,功能强大,特点突出,技术先进,服务优良。在Google的索引目录中贮存了30多亿个网页及网页快照,以及4亿多张图片,用户可以使用86种语言文字进行搜索。Google自动带有“AND”功能进行查询,用空格表示逻辑“与”的操作,Google用减号“-”表示逻辑“非”操作,用大写“OR”(小写的or,查询时将被忽略,变成“与”的查询)表示逻辑“或”操作。Google不支持通配符*、?等的搜索,只能做精确查询,关键字后面的通配符会被忽略掉。Google对英文字符大小写不敏感,所有的字母均作小写处理。例如:搜索“FOOTBALL”、“football”或“Football”,得到的结果都一样。Google的检索语法特点Google关键字可以是词组(中间无空格),也可是句子(中间有空格),用句子做关键字搜索,须加英文引号(精确检索)。Google对一些网络上出现频率极高的词(主要是英文单词),如“i”“com”“http”,以及一些符号如*“的”等均做忽略处理,若要求关键字中包含这些常用词,用“”精确检索。(英文符号,如问

文档评论(0)

135****3907 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档