搜索引擎原理与检索技巧.pptVIP

  • 2
  • 0
  • 约6.38千字
  • 约 36页
  • 2018-12-28 发布于湖南
  • 举报
词组检索 使用双引号(在输入法半角的状态中输入) 当您输入较长的查询词时,搜索引擎会依据查询词的字符串做拆字处理。若您需要得到精确、不拆字的搜索结果,可在查询词前后加上双引号。 例如:华南师范大学考研 与 “华南师范大学考研” 高级搜索语法 Intitle(在GOOGLE中是allintitle) intitle的意思是所有搜索结果的网页的标题中都要包含“关键词A”。 格式:关键词B intitle:关键词A(多个个关键词中最重要的词放此)[只适用在百度中] allintitle:关键词A[用于GOOGLE中] 例:查找有关温总理访日融冰之旅方面的信息 温家宝 融冰之旅 与intitle:温家宝融冰之旅 又例:查找圆明园的历史 由于“圆明园”这个词非常关键,如果选择”圆明园 历史“这个搜索式不如选”历史 intitle:圆明园“(结果是:在所有标题中包含”圆明园“这个词的网页中寻找出现”历史“这个关键词的结果) 高级搜索语法 Inurl(在GOOGLE中是allinurl) url是Uniform Resource Locator(统一资源定位符)的缩写,简单地说,就是地址栏里的东西。意思是在url中含有关键词B的网页中,寻找关于关键词A的信息。 格式:关键词A inurl:关键词B(关键词A与inurl之间要用空格隔开) 例:图书馆 inurl:lib 高级搜索语法 SITE site是限定在某个网站内搜索关键词A 格式:关键词A site:(即某个域名/网站) 例:在新浪网中查找有关融冰之旅的信息 融冰之旅 site: 高级搜索语法 FILETYPE filetype 是限定搜索结果的文件类型。互联网上,存在大量非网页格式的资料,如word文件、pdf文件等。filetype是专门特定格式文件的。 格式:关键词A filetype:文件格式后缀名 例:入党申请书 filetype:doc,搜索结果全都是word文件。 Google中的其它功能 翻译:T 在线文档处理 :D 搜索引擎的发展趋势 一个好的搜索引擎,不仅数据库容量要大,更新频率、检索速度要快,支持对多语言的搜索,而且随着数据库容量的不断膨胀,还要能从庞大的资料库中精确地找到正确的资料 搜索引擎的发展趋势  ⒈提高搜索引擎对用户检索提问的理解。为了提高搜索引擎对用户检索提问的理解,就必须有一个好的检索提问语言。为了克服关键词检索和目录查询的缺点,现在已经出现了自然语言智能答询。用户可以输入简单的疑问句,比如“如何能杀死计算机中的病毒”,搜索引擎在对提问进行结构和内容的分析之后,或直接给出提问的答案,或引导用户从几个可选择的问题中进行再选择。自然语言的优势在于,一是使网络交流更加人性化,二是使查询变得更加方便、直接、有效。就以上面的例子来讲,如果用关键词查询,多半人会用“病毒”这个词来检索,结果中必然会包括各类病毒的介绍,病毒是怎样产生的等等许多无用信息,而用“如何能杀死计算机中的病毒”检索,搜索引擎会将怎样杀死病毒的信息提供给用户,提高了检索效率。 搜索引擎的发展趋势 ⒉垂直主题搜索引擎有着极大的发展空间。网上的信息浩如烟海,网络资源以惊人的速度增长,一个搜索引擎很难收集全所有主题的网络信息,即使信息主题收集得比较全面,由于主题范围太宽,很难将各主题都做得精确而又专业,使得检索结果垃圾太多。这样以来,垂直主题的搜索引擎以其高度的目标化和专业化在各类搜索引擎中占据了一席之地。目前,一些主要的搜索引擎,都提供了新闻、Mp3、图片、Flash等的搜索,加强了检索的针对性。 搜索引擎的发展趋势 ⒊元搜索引擎,能够提供全面且较为准确的查询结果。现在的许多搜索引擎,其收集信息的范围、索引方法、排名规则等都各不相同,每个搜索引擎平均只能涉及到整个Web资源的30-50%,这样导致同一个搜索请求在不同搜索引擎中获得的查询结果的重复率不足34%,而每一个搜索引擎的查准率不到45%。元搜索引擎(META Search Engine)是将用户提交的检索请求发送到多个独立的搜索引擎上去搜索,并将检索结果集中统一处理,以统一的格式提供给用户,因此有搜索引擎之上的搜索引擎之称。它的主要精力放在提高搜索速度、智能化处理搜索结果、个性化搜索功能的设置和用户检索界面的友好性上,查全率和查准率都比较高。 * 搜索引擎 ——原理与检索技巧 搜索引擎的概念 搜索引擎: 就是在Internet上执行信息搜索的专门站点,它们可以对主页进行分类与搜索。如果输入一个特定的搜索词,搜索引擎就会自动进入索引清单,将所有与搜索词相匹配的内容找出,并显示一个指向存放这些信息的连接清单

文档评论(0)

1亿VIP精品文档

相关文档