- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
互联网基础性技术元搜索引擎概述.doc
互联网基础性技术元搜索引擎概述
互联网基础性技术元搜索引擎概述
元搜索引擎是互联网基础性技术,其对于互联网的发展起到了巨大的推动作用。针对元搜索引擎的研究,能够有效地提升对互联网的使用效率.L.。本文主要就元搜索引擎的基本特点、工作原理以及系统结构等几个方面对其展开研究,同时也就其存在的问题进行初步的探讨,希望能够对从事相关工作的人员有所启发。
一、元搜索引擎概述
(一)元搜索引擎
元搜索引擎是由检索请求提交机制、检索接口代理机制、以及检索结果显示机制所组成的信息收集与处理程序。请求提交的主要功能是将用户的个性化信息检索要求,提交给检索接口代理机制,其中包括的内容有所采用的搜索引擎的种类,检索时间、以及数量等。接口代理在接到请求后,将所提交的信息转换成计算机可以识别的语言,并且从本地数据库内调去用户所需要的信息,并且将信息提交给结果显示,结果显示会将信息进行重新整理,并且以用户能够识别的方式进行输出。这是元搜索引擎的基本工作机制。
(二)元搜索引擎的原理
元搜索引擎是一种双层客户机,或者说是一种以服务器为基础的系统。其主要的功能就是根据客户检索请求,向单个或是多个搜索引擎提出检索要求,然后由具体的搜索引擎执行。搜索引擎执行元搜索引擎检索请求后将检索结果反馈给元搜索引擎,元搜索引擎则从多个搜索结果中整理出最佳的结果反馈给用户。不同的元搜索引擎可能在机制上存在着一定的差异,但是其基本原理是相同的。
(三)元搜索引擎的分类
元搜索引擎可以分为目标搜索式引擎、提问搜索式引擎等。这种分类主要是根据搜索引擎的编译方式和显示结果来区分的。不同的搜索引擎存在着很大的区别。目标式搜索引擎可以连续对目标进行搜索。另外一些则是根据不同的提问,同时进行搜索。提问式搜索引擎具有将检索提问变成目标搜索引擎的提问语言,而有一些则原封不懂的发送给目标引擎。元搜索引擎还可以根据功能进行划分,其中多线搜索式当今搜索引擎的主流,All in One式搜索引擎也是一种十分流行的搜索引擎模式。
二、元搜索引擎的系统模块研究
(一)GUI图形化用户接口
GUI图形化接口的主要功能是实现用户与程序之间的信息交互,其能够将用户所发出的原始信息转换成计算机可以识别的语言,并且将搜索结果以图形的方式反馈给用户。GUI图形化用户接口,能够以使用命令的方式,实现人机交互,并且将用户的查询请求提交给系统。
同时,GUI界面能够为用户设定搜索引擎成员列表,根据不同的搜索引擎特性,为用户选择最为适合的引擎。并且自动设定等待时间、反馈结果数量以及反馈方式等。这部分信息可以保存在客户端的用户cookie中,以便用户下次调取,从而提高使用效率。Cookie的主要功能就是保存搜索记录,并且对于搜索结果进行深入的整理和挖掘,便于用户的调取和使用。
(二)查询预处理器
查询预处理器的主要功能是将原始查询请求进行分类处理,并且通过交叉语言检索功能以及自然语言检索功能进行编辑,然后将所需要查询的信息进行重新分类整理。
(三)成员搜索引擎调度器
用户可以根据搜索习惯以及搜索历史,设定具有个性化的搜索引擎,也就是说元搜索引擎能够为用户提供个性化的搜索服务。如果用户并不满意自己的设定的成员搜索引擎,则可以根据成员搜索引擎的调度机制,将主题、领域以及区域等信息,添加到原有的成员搜索引擎之中,从而改变原有引擎的搜索习惯。例如,用户可以添加相应时间、反馈数量等等,从而生产出符合自己需求的搜索引擎列表。由于成员搜索引擎的信息(特别是查询串的格式化信息)经常发生变化,如果将它们的代码固定在元搜索引擎得主程序中显然是不合理的,因此我们采用了成员搜索引擎描述文件,以xml进行描述,采用形式化描述,对于每个新加入的成员搜索引擎,只要按照这个形式为其建立一个描述文件,就很容易将其加入到系统中。
(四)查询分发器
查询分发器的主要功能是接受成员引擎的调度列表,通过调用数据库信息,读取成员引擎的信息。并
且根据这些信息,启动相应的成员引擎,同时向它们发送查询信息。查询信息的主要内容有:主机信息;连接信息;查询参数的格式信息等。查询功能主要依靠的是数据库连接,其中部分信息是通过查询代理来进行的。一方面可以减少数据库的连接次数,另一方面可以在最大程度上集中使用查询信息,从而提高查询速度。
(五)查询代理
查询代理的主要功能是提供元搜索引擎所需的交互接口。其具体的机制是首先从分发器中提取查询格式,然后向分发器回馈查询参数信息,而后根据查询结果将查询信息进行本地化处理,如果成员搜索引擎无法支持元搜索引擎的高级检索功能,那么其必须将查询信息转化成其所能够接受的格式。比如:不支持短语检索,通配符功能等。在处理的时候,删除原来
文档评论(0)