- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四节 搜索引擎 5.4.1 搜索引擎的概念与基本功能 随着互联网的迅速发展,网上信息也以惊人地速度增长,为了快速地检索网上信息,人们开发研制了一种信息检索工具,即搜索引擎。 搜索引擎实际上就是对WWW站点资源和其他网络资源进行标引并提供检索服务的服务器或网站,是一个基于互联网的信息搜集、组织和用户查询的平台。 从用户的角度看,这种软件系统提供一个网页界面,让用户通过浏览器提交检索提问式,然后迅速返回一个和用户输入内容可能相关的信息列表。 5.4.1 搜索引擎的基本概念与功能 (一)一般检索功能 布尔逻辑检索(boolean logic) 该功能在搜索引擎中的使用相当广泛,但表现不同: 首先是受支持的程度不同。 其次是提供运算的方式不同。 5.4.1 搜索引擎的基本概念与功能 词组检索(phrase search) 词组检索是将一个词组(通常用双引号“”括起)当作一个独立运算单元,进行严格匹配,使得检索结果只包含有双引号括起的词组。 几乎所有的搜索引擎都支持词组检索,并且都采用双引号(“”)来表示词组或在菜单中进行选择。 5.4.1 搜索引擎的基本概念与功能 截词检索(truncation search) 指用词干做检索词来查找含有该词干的全部检索词的记录,检索提问式中的截词符号表示检索词中的可变部分,词干加上由截词符号所代表的任何变化形式构成的词都是合法的检索词。 目前多数搜索引擎只提供右截法,而且搜索引擎中的截词符通常采用星号*。 5.4.1 搜索引擎的基本概念与功能 位置检索(proximity search) 位置检索,又称邻近检索,用特定的符号规定检索提问式中的检索词在检索结果中的相对位置,常用符号的有“NEAR”和“ADJ”。 5.4.1 搜索引擎的基本概念与功能 字段检索(fields search) 字段限制检索在一般的数据库检索中有前缀限制和后缀限制两种形式,而在搜索引擎中多表现为前缀限制的形式。 用户可以把查询Web信息资源时的范围限制在标题(Title:),主机名(host:),域名(domain:),链入(in1ink:);链出(outlink:),URL(site:)等。 5.4.1 搜索引擎的基本概念与功能 (二)高级检索功能 加权检索(term weighting) 现在搜索引擎约定俗成的加权方法是,如果要求检索词必须出现在检索结果中,则在该检索词前加“+”;如果要求检索词不能出现在检索结果中,则在该检索词前加“-”。而且“+”、“-”与检索词之间不能留有空格。 用户在实际使用带有加权检索符号的检索提问式时会发现,检索过程中未加符号的检索词的作用被削弱。 5.4.1 搜索引擎的基本概念与功能 自然语言检索 (natural language search) 自然语言检索指用户在检索时可以输入同一般口语一样的、用自然语言表达的检索提问式。 搜索引擎在接收到用户的自然语言提问式后,首先依据禁用词表判断剔除提问式中没有实质主题意义的词汇,如各种代词、副词、介词、请求词、提问词等,然后将与剩余词汇相关的同义词或近义词排序列出并进行检索,最后将检索结果按照相关度高低顺序排列。自然语言检索的出现,使得检索式的组成不再依赖于专门的检索语言,检索变得简单而直接,尤其适合非专业检索者的使用。 5.4.1 搜索引擎的基本概念与功能 多语种检索 指系统为检索者提供多个语言种类的检索环境,检索者可以根据自己的需要指定语言种类并进行检索。 多语种检索有两种情况: 一种是检索词为不同语种,检索结果也为不同语种,检索过程中没有翻译步骤; 另一种是检索词为同一语种,而检索结果为不同语种。 5.4.1 搜索引擎的基本概念与功能 区分大小写的检索(case-sensitive) 主要针对含有地名、人名等专有名词的检索词。 在区分大小写的情况下,大写检索词被作为专有名词看待(如Rose代表姓氏),而小写检索词则被视为普通词(如rose则表示玫瑰)。 在不区分大小写的情况下,则无法区分该检索词属于专有名词还是普通词,从而影响了检索结果的准确性。 5.4.1 搜索引擎的基本概念与功能 相关信息反馈 (relevance feedback) 相关信息反馈检索的基本原理是搜索引擎将用户所选定的结果网页中包含的关键词找出,通过
您可能关注的文档
- 新信号与系统理论和实训 教学课件 任利华 信号的分解与合成.ppt
- 新信号与系统理论和实训 教学课件 任利华 信号的基本运算.ppt
- 新信号与系统下册 系统分析与设计 教学课件 程耕国 第6章.ppt
- 新信号与系统下册 系统分析与设计 教学课件 程耕国 第7章.ppt
- 新信号与系统下册 系统分析与设计 教学课件 程耕国 第8章.ppt
- 新信号与系统下册 系统分析与设计 教学课件 程耕国 第9章.ppt
- 新信号与系统下册 系统分析与设计 教学课件 程耕国 第11章.ppt
- 新信号与系统下册 系统分析与设计 教学课件 程耕国 第12章.ppt
- 新信号与系统——信号分析与处理 上册 教学课件 程耕国 第1章.ppt
- 新信号与系统——信号分析与处理 上册 教学课件 程耕国 第2章.ppt
原创力文档


文档评论(0)