网络信息检索讲义.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
专业文档搜索 很多有价值的资料,在互联网上并非是普通的网页,而是以Word、PowerPoint、PDF等格式存在。百度支持对Office文档(包括Word、Excel、Powerpoint)、Adobe PDF文档、RTF文档进行了全文搜索。 方法为:在“Filetype:”后跟以下文件格式:DOC、XLS、PPT、PDF、RTF。例如,查找张五常关于交易费用方面的经济学论文。“交易费用 张五常 filetype:doc”, 您也可以通过 百度文档搜索界面(/) ,直接使用专业文档搜索 百度文档搜索界面 入党申请书范文 检索结果 基本检索 基本检索规则 输入多个词语搜索(不同字词之间用一个空格隔开,可以获得更精确的搜索结果)。在百度查询时不需要使用符号“AND”或“+”,百度会在多个以空格隔开的词语之间自动添加“+”。并把最相关的网页排在前列。 高级搜索语法 1、intitle:把搜索范围限定在网页标题中 例如,找在网页标题中含有北京联合大学的网页,查询格式: intitle:北京联合大学 注意,intitle:和后面的关键词之间,不要有空格。 高级搜索语法 2、site:把搜索范围限定在特定站点中.使用的方式,是在查询内容的后面,加上“site:站点域名”。 例如,天空网下载软件查询格式: msn site: 注意,“site:”后面跟的站点域名,不要带“http://”;另外,site:和站点名之间,不要带空格。 高级搜索语法 3、双引号精确匹配 如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果您对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。 例如,搜索 上海大学,如果不加双引号,搜索结果被拆分,效果不是很好,但加上双引号后,“上海大学”,获得的结果就全是符合要求的了。 高级搜索语法 4、书名号精确匹配 书名号是百度独有的一个特殊查询语法。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。 书名号在某些情况下特别有效果。 例如,查名字很通俗和常用的那些电影或者小说。比如,查电影“手机”,如果不加书名号,很多情况下出来的是通讯工具——手机,而加上书名号后,《手机》结果就都是关于电影方面的了. 高级搜索语法 5、减号语法要求搜索结果中不含特定查询词. 例如,搜 神雕侠侣,希望是关于武侠小说方面的内容,却发现很多关于电视剧方面的网页。那么就可以这样查询:神雕侠侣 -电视剧。 注意,前一个关键词,和减号之间必须有空格,减号和后一个关键词之间,有无空格均可。 限定在标题中检索( intitle:) 限定在标题中检索( intitle:) 2、目录搜索引擎 目录索引类搜索引擎简介 目录索引虽然有搜索功能,但严格意义讲算不上是真正的搜索引擎。仅仅是按目录分类的网站链接列表而已。为便于检索,目录同时提供关键词检索,但搜索保存的是互联网上各网站的站名、网址和内容提要 。由于是人工编辑,其信息量相对较小,更新速度较慢,查全率不高。目录索引中最具代表性的莫过于久负盛名的 Yahoo(雅虎)。国内的搜狐、新浪、网易搜索也都属于这一类。 2006年以后Yahoo(雅虎)与GOOGLE形成伙伴关系,成为混合型搜索引擎。即:有目录搜索引擎功能,也有全文搜索引擎功能。 YAHOO搜索引擎(/) Yahoo是最著名的目录索引类搜索引擎。1994年斯坦福大学的两位电子工程学博士生开始编制一个自己感兴趣的 Internet上的站点目录,这就是最原始的 Yahoo,1995年成立 Yahoo公司。在全球共有24个网站,12种语言版本。雅虎中国网站()于1999年9月正式开通,是雅虎在全球的第20个网站。 可以通过两种方式在上面查找信息,一是通常的关键词搜索,一是按分类目录逐层查找。 3、元搜索引擎 3、元搜索引擎 元搜索引擎不同于传统的独立的搜索引擎,其本身没有搜索引擎的网页搜寻机制,也没有自己独立的索引数据库,而只是定制统一的检索界面,通过调用其他搜索引擎的检索功能来实现查询。 原理:接受查询请求,向多个搜索引擎递交,将结果进行去除重复,重新排序等处理后,返回给用户。 特点:没有自己的数据,返回的结果信息量更大、更全,但不能充分使用所有搜

文档评论(0)

ddf55855 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档