网站大量收购独家精品文档,联系QQ:2885784924

网络信息资源的检索.pptxVIP

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络信息资源的检索第1页/共83页 定义是指通过网络存储的数字化图、文、声、像等多媒体信息的集合。与传统信息资源相比较,其主要特征是数字化和网络存取。百度QQ第2页/共83页 网络信息资源的特点信息量大,传播广泛信息层次多,品种多样自由发布,交流直接信息传播速度快,变化频繁分散无序,缺乏管理检索方便内容质量不一网络信息资源文本图像图形表格超文本第3页/共83页 网络信息检索方法 直接如:网络资源指南搜索引擎第4页/共83页 网络信息检索工具定义:是指在因特网上提供信息检索服务的计算机系统。原理:网络资源搜集资源提供资源第5页/共83页 搜索引擎定义:搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务的系统。第6页/共83页 搜索引擎原理搜索程序 处理程序(索引)检索程序蜘蛛或机器人第7页/共83页 搜索引擎分类按工作方式划分:全文搜索引擎目录索引类搜索引擎元搜索引擎第8页/共83页 搜索引擎分类全文搜索引擎通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,是名副其实的搜索引擎。在国外具有代表性的搜索引擎有Google等,国内著名的有百度等。内容全,更新快,功能强,命中率低,结构不清晰第9页/共83页 搜索引擎分类目录索引类搜索引擎虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。在国外代表DMOZ - the?Open Directory Project等结构清晰,内容少,更新慢,第10页/共83页 搜索引擎分类元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有360搜索。第11页/共83页 搜索引擎分类元搜索引擎第12页/共83页 搜索引擎一般查询规则连接符逻辑“与”一般用“and”表示,提高查准率逻辑“或”一般用“or”表示,提高查全率逻辑“非”一般用“not”表示,缩小范围第13页/共83页 搜索引擎一般查询规则截词符一般按截断的位置可以分为前方截词,中间截词,后方截词。一般用“?”和“*”等表示截词符。前方截词(后方一致):“? ology”可检出:methodology, biology, radiology中间截词:“wom? n”,woman和women后方截词(前方一致):“comput?”可检索出compute、 computer、 computing等第14页/共83页 搜索引擎一般查询规则空格、逗号、括号和引号空格的作用与逻辑“与”和“and”是相同的如 计算机 维护逗号相当于逻辑“或”和“or”括号用于改变复杂检索式中逻辑运算符的优先顺序,在括号中的优先执行。如:多媒体 and (计算机 or 网络)引号括中其中的多个词被当作一个短语。如:“ electronic magazine” electronic magazine第15页/共83页 搜索引擎一般查询规则限定字段检索限定在标题,正文,网址等。第16页/共83页 中国搜索分布情况数据来源: /第17页/共83页 数据来源: /第18页/共83页 数据来源: /第19页/共83页 国内外著名搜索引擎主要国内搜索引擎百度()百度,全球最大的中文搜索引擎、最大的中文网站。2000年1月创立于北京中关村。以网络搜索为主的功能性搜索,以贴吧为主的社区搜索,针对各区域、行业所需的垂直搜索,Mp3搜索,以及门户频道、IM等,全面覆盖了中文网络世界所有的搜索需求,根据第三方权威数据,百度在中国的搜索份额超过80%。 第20页/共83页 国内外著名搜索引擎主要国内搜索引擎百度()高级搜索:把搜索范围限定在网页标题中——intitle 例如,找云南省风景相关信息,就可以这样查询:风景 intitle:云南 注意,intitle:和后面的关键词之间,不要有空格。 第21页/共83页 国内外著名搜索引擎主要国内搜索引擎百度()高级搜索:把搜索范围限定在特定站点中——site 例如,天空网下载软件不错,就可以这样查询:msn site: 注意,“site:”后面跟的站点域名,不要带“http://”;另外,site:和站点名之间,不要带空格。 第22页/共83页 国内外著名搜索引擎主要国内搜索引擎百度()高级搜索:把搜索范围限定在url链接中——inurl 例如,找关于ph

文档评论(0)

kuailelaifenxian + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体太仓市沙溪镇牛文库商务信息咨询服务部
IP属地上海
统一社会信用代码/组织机构代码
92320585MA1WRHUU8N

1亿VIP精品文档

相关文档