- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于AJAX的智能检索在Web搜索的研究
摘要:为了实现Web智能检索,提出一种Web智能搜索引擎的模型,它是基于自然语言库和本体库对关键词进行解析,在AJAX模式中实现启发式检索,收集和使用用户反馈的重要叁数,并在此基础上设计和实现了一个Web搜索引擎。
关键词:智能检索;AJAX;Web智能搜索模型;自然语言;本体
中图分类号:TP391文献标识码:A文章编号:1009-3044(2008)25-1515-04
Design and Implement of Web Search Engine Based on AJAX and Intellectual Retrieval
LIU Hai-yong, ZHENG Yong-qian
(Department of Mechanical Engineering, TongJi University, Shanghai 201804, China)
Abstract: In order to build intellectual Web search engine, the paper proposes a frame, which could parse keywords on the base of natural languages and ontologies, automatically give users search suggestion and analyze some important parameters feed by users in the AJAX model. Besides, design and implement a Web search engine to verify the frames availability.
Key words: intellectual retrieval; AJAX; Web intellectual search model; natural language; ontology
1 引言
首先,传统的基于关键词匹配的搜索方法,仅靠目标文档中是否出现用户查询所用的关键词来判断文档的相关性。这种以词为中心建立关联的方式,缺乏语义理解能力,容易割裂文档内容间的知识关联,也未能妥善解决一词多义、一义多词问题。特别是在网络环境下,检索系统面向的是普通终端用户,他们一般不具备专业的搜索知识,在表达其需求尤其是构造基于关键词的标准检索表达式时存在较大困难。如果能够提供基于关键词的解析,则可以减轻终端检索用户的认知负担,增强系统的知识处理能力,能够弥补目前基于关键词检索的不足,提高信息检索的效率。
其次,搜索引擎的技术发展要求,就是将搜索结果尽可能地按照相关度的大小进行排序,为用户完成一次二次搜索的过程,这在很大程度上节约了用户的时间,提高了搜索的效率。当前网络搜索引擎的巨头主要采取PageRank算法(或类似的算法,比如百度的“超链分析技术”)。如果能对此算法进行改进,加入一些反馈的特征向量,比如链接的质量,用户的行为等参数,可以让用户体验到智能搜索的便利。
针对这些问题,提出了一个能对关键词语义理解提供支持和检索结果适当排序的智能搜索模型,并使用Ajax模式开发出一个基于Web启发式智能搜索引擎的实验原型系统。
2 智能检索模型和关键技术
因此,Web启发式智能搜索引擎开发的主要问题:智能搜索模型的构建,关键词的解析,辅助特征向量信息搜集和启发式功能的实现。
2.1 智能检索模型的构建
为了克服当前模型的缺陷,实现智能搜索,提出一个新的搜索模型,如图1所示。
■
图1 智能搜索模型
2.1.1 基于自然语言的关键字解析
基于自然语言的检索,优点明显,比如减轻用户负担、易于新事物的检索和增强系统的易用性等,但是,目前语言学的技术研究远未成熟,基于自然语言的关键字解析成为目前较为现实的选择。与传统的简单匹配不同,本系统将建立基于关键词的自然语言索引库,对用户输入的关键词联想匹配,这在很大程度上保障了检索的查全率。
2.1.2 基于本体网络的关键字解析
“本体是关于共享概念的协议。共享概念包括对领域知识建模的概念框架、可互操作的系统通信协议和特定领域理论的表示协议。在知识共享环境中,本体以定义表达词汇的形式获得描述。[1]”
定义1本体模型:对于给定描述语言L,本体模型是一个4元组,记作O=<T, X, TD, XD>。其中,T是概念集。T中的概念包括原子类C与原子属性P,记为T = <C, P>。原子属性有2种类型:类属性和数值属性。类属性表示类间的关系,而数值属性表示类的属性;T
文档评论(0)