【广告策划-PPT】网络信息资源检索.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
【广告策划-PPT】网络信息资源检索.ppt

第五讲 网络信息资源检索 主要内容 1.搜索引擎 2.FTP信息资源 3.BBS信息资源 4.USENET/Newsgroup信息资源 5.LISTSERV/Mailing list信息资源 6.其他网络资源 搜索引擎 搜索引擎发展 搜索引擎原理 搜索引擎主要技术 搜索引擎系统分类 搜索引擎的应用 搜索引擎发展 1990年以前,没有任何人能搜索互联网 所有搜索引擎的祖先:Archie 最早现代意义上的搜索引擎出现于1994年7月(Lycos Yahoo! ) 搜索引擎原理 搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序 搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库 搜索引擎,也不能真正理解网页上的内容,它只能机械的匹配网页上的文字 搜索引擎只能搜到它网页索引数据库里储存的网页文字信息。 如果搜索引擎的网页索引数据库里应该有而你没有搜出来,那是你的能力问题,学习搜索技巧可以大幅度提高你的搜索能力 搜索引擎技术 ? algorithms ? artificial intelligence ? compiler optimization ? computer architecture ? computer graphics ? ? data compression ? data mining ? file system design ? genetic algorithms ? information retrieval ? ? machine learning ? natural language processing ? operating systems ? profiling ? robotics ? ? text processing ? user interface design ? web information retrieval ? and more! 搜索引擎系统分类 按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类: 1.全文搜索引擎 (Google,百度,中搜) 2.目录索引(Yahoo,DMOZ,LookSmart) 3.元搜索引擎 (META Search Engine) (Dogpile) / / 搜索引擎的应用 网页搜索 特色搜索 学术搜索 商业搜索 网页搜索(Google) Google检索网页数量达42.8亿,搜索引擎中排名第一;网页图片8.8亿张 . Google支持多达132种语言,包括简体中文和繁体中文; Google网站只提供搜索引擎功能,没有花里胡哨的累赘; Google速度极快,超过50 000台服务器; Google的专利网页级别技术PageRank能够提供准确率极高的搜索结果; Google智能化的“手气不错”功能,提供可能最符合要求的网站; Google的“网页快照”功能,能从Google服务器里直接取出缓存的网页。 Google具有独到的图片搜索功能; Google具有强大的新闻组搜索功能; Google具有二进制文件搜索功能(PDF,DOC,SWF等); Google还有很多尚在开发阶段的令人吃惊的设想和功能。 初阶搜索 搜索引擎最基本的语法: Google分别用“ ”(空格)、“-”和“OR”表示“与”“非”和“或” 杂项语法 通配符问题 关键字的字母大小写 搜索整个短语或者句子 搜索引擎忽略的字符以及强制搜索 进阶搜索 面已经探讨了Google的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西 对搜索的网站进行限制 site: 如九寨沟 site: 在某一类文件中查找信息 filetype: 目前已经可以支持13种文件类型,如doc, ppt, xls, swf,ps,jpg,gif, pdf 如 4G filetype:doc 搜索的关键字包含在URL链接中 inurl: 如 virus inurl:secutiry 搜索的关键字包含在网页标题中 intitle: 如intitle:交通规划 filetype:pdf inurl: 目录检索 如果不想搜索广泛的网页,而是想寻找某些专题网站,可以访问Google的分类目录“http://directory.G/”, 分类的网站目录一般由专人负责,分类明确,信息集中 目前Google使用的分类目录采用了ODP的内容 另外,Google根据其专业的“网页级别”(PageRank)技术对目录中登录的网站进行了排序,可以让一般的检索更具高效率 学术搜索 大学搜索 Google的其他杰出功能 网页快照 单

文档评论(0)

cnsg + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档