因特网信息资源检索.pptVIP

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
10 因特网信息资源检索 10.1 搜索引擎 10.2 常用中文搜索引擎的使用 10.3 常用中英文目录型网络检索工具 10.1 搜索引擎 10.1.1搜索引擎 的定义 搜索引擎(Search Engine)是指对因特网各种信息资源进行标引和检索的工具。 搜索引擎使用自动搜索软件来采集、发现、收集并标引网页、建立数据库,以WWW页形式提供给用户一个检索界面,供用户通过关键词、词组或短语等检索项来进行检索。 10.1.2 搜索引擎工作原理 1.信息的采集与存储 人工采集: 由专门的信息人员跟踪和选择有用的WWW站点或页面,并按规范方式分类标引并组建成索引数据库。 自动采集: 是通过自动索引软件(Spider、Robot或Worm)在网络上不断搜索相关网页来建立、维护、更新索引数据库的。自动采集能够搜索、采集和标引网络上众多站点和页面,并根据检索规则和数据类型对数据进行加工处理,因此它收录、加工信息的范围广、速度快,能及时地向用户提供Internet中的新增信息,及其检索提问的所有网址并提供链接点。 2、建立索引数据库 信息采集与存储后,搜索引擎要对已收集的信息进行整理,建立索引数据库,并定时更新数据库内容。索引数据库中每一条记录基本对应于一个网页,记录包括关键词、网页摘要、网页URL等信息。 3、检索界面的建立 每个搜索引擎都必须提供一个良好的信息查询界面,接收用户在检索界面中提交的搜索请求,搜索引擎根据用户输入的关键词,在索引数据库中查找,把查询命中的结果(均为超文本链接形式)通过检索界面返回给用户,通过搜索引擎提供的链接,即刻访问相关信息。 10.1.3 搜索引擎的基本检索功能 1、布尔逻辑检索 2、词组检索 3、截词检索 4、字段检索 5、自然语言检索 6、多语种检索 7、区分大小写检索 10.2 常用中文搜索引擎的使用 10.2.1 百度中文搜索引擎 百度()于1999年底成立于美国硅谷,是由资深信息检索技术专家、超链分析专利的唯一持有人李彦宏及徐勇博士创建的。 百度是世界上最大的中文搜索引擎,支持搜索4亿中文网页,并且每天增加几十万新网页,对重要中文网页实现每天更新,用户通过百度搜索引擎可以搜索到世界上最新最全的中文信息。百度标题下,对新闻搜索、网页搜索等最常用的搜索对象做出了链接,可在特定范围内搜索信息。 1. 百度的检索方式和检索功能 关键词检索 高级检索 2. 百度中文搜索引擎的检索语法特点 (1)不支持逻辑运算“AND”、“OR”的使用,用“│” 表示逻辑“或”。如用户要查询“足球”或“申花”相关资料,不需要分两次查询,只要输入“足球│申花”。用减号“-”表示逻辑“非”操作,如需查询关于“足球”但不含“意大利”的资料,输入“足球-意大利”即可搜索到相关信息。 (2)用“ ” 表示精确检索(词组 短语 或 句子) (3)百度对英文字符大小写不敏感,所有的字母均作小写处理。例如:搜索“FOOTBALL”、“football”或“Football”,得到的结果都一样。 3. 百度的高级搜索语法 (1)site:表示搜索结果局限于某个具体网站或某域名内的网页。如: 网球site: 表示在体坛周报网站内搜索和足球相关的资料; 足球site: 表示在域名以“”结尾的网页内搜索和足球相关的资料。 (2)file type:表示限定检索某种文献类型。 如“filetype:pdf flash教程” 即检索有关flash教学的PDF文档 (3) intitle:在标题中搜索。 例如 :“intitle:足球” 表示搜索标题中含有关键词“足球”的网页; “intitle:足球 中国” 表示搜索标题中 “足球”和“中国”的网页。 (4) URL搜索:在“inurl”后加url中的文字,表示限制在网页的URL中检索。例如:“inurl:足球”表示搜索URL中含有足球的网页。 10.2.1 Google搜索引擎 Google()是目前因特网上最优秀的支持多种语种的搜索引擎之一,功能强大,特点突出,技术先进,服务优良。在Google的索引目录中贮存了30多亿个网页及网页快照,以及4亿多张图片,用户可以使用86种语言文字进行搜索。 1. 检索方式和检索功能 关键词检索。在Google标题上方排列了几大功能模块:网站搜索、图象、新闻、网上论坛、GMAIL,默认的是所有网站搜索。 高级检索:对搜索结果进行更多设定,如各种语言、文件格式、日期、检索内容位于网页的不同位置等,并对每个页面显示搜索结果数量做出设定。 2. Google的检索语法特点 (1)Google自动带有“AND”功能进行查询,用空格表示逻辑“与”的操作,Googl

文档评论(0)

junjun37473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档