- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于本体论个性化网络信息检索模型
一种基于本体论的个性化网络信息检索模型
关键词:本体论;个性化;信息检索
摘 要:传统的网络信息检索存在很多缺陷,本文提出了一种基于本体论的个性化网络信息检索的模型。该模型的实现可以在一定程度上缓解Internet网上信息过载的问题,为用户提供个性化信息检索服务,提高网络信息检索的准确率。
中图分类号:G250 文献标识码:A 文章编号:1003-1588(2011)04-0116-03
由于网络中的信息浩如烟海、内容庞杂、组织松散,为找到有用信息,人们经常要耗费大量宝贵的时间,人们在信息检索中普遍遇到了“返回信息过多”与“用户可用信息过少”的问题。如何协助用户方便有效地从浩如烟海的网络信息中获取有用的信息是非常具有现实意义的一个课题。鉴于此,本文提出了一种基于本体论的个性化网络信息检索的模型。
1 问题的提出
目前人们在利用搜索引擎进行信息检索的过程中,普遍遇到了“信息过载”的问题,即系统返回的信息量过多,远远超过了用户所能接受和处理的能力。虽然返回的信息数量巨大,但是有相当数量的信息却并不是用户所需要的,使得用户将大量的时间耗费在排除无关的信息上,也就是说搜索引擎的查准率较低;同时,又由于检索用户和网络文档对同一概念的表达形式往往会有差异,这又导致许多有用的信息用户无法检索到,也就是说搜索引擎的查全率也是较低的。造成这一现象产生的根本原因在于当前的搜索引擎存在有以下两大方面的不足。
1.1 基于关键词的标引和检索方式不符合语义理解的需要
现有的搜索引擎提供的检索方式几乎都是基于关键词的方式,虽然基于关键词的检索方式给人们的检索带来了很大的方便,但它却不能很好地表达用户的检索需求。这主要表现为:第一,关键词语言是一种自然语言,随着时间、地域、领域的改变,同一词汇可以表达不同的语义概念,即“一词多义”的现象;同一概念也可以使用不同的词汇表达,即“一义多词”的现象。第二,在人的大脑中,概念不是孤立存在的,它总是与其它概念之间存在着各种联系,用户在检索一个词时除了希望得到包含该词的资源之外,还希望得到与该词相关的其它信息。在传统的检索技术条件下,这种概念关联的检索是实现不了的。
1.2 个性化能力太差
现在的搜索引擎对所有的用户采用的都是同一种模式,不同的用户只要用相同的关键词进行查询,得到的结果将会是一样的。显然,这样的搜索引擎个性化能力太差,它没有考虑到每个用户的个体差异,不能根据用户背景、爱好的不同,获取用户不同的个性化信息需求,给出不同的检索结果。
从以上搜索引擎存在的不足我们可以看出,当前的搜索引擎在进行网上信息收集和提供查询服务方面存在着严重的效率和质量问题。本体论作为一种新的知识表示方式,由于具有良好的概念层次结构和对逻辑推理的支持,因而在实现智能化的网络信息检索中具有广阔的应用前景。通过本体论,一方面可以把信息检索从基于关键词的层次提高到基于概念的层次,从而提高系统的查准率与查全率;另一方面还可以对概念的相关性进行推理,挖掘出用户的真正需求所在,从而实现智能化的信息检索。
2 一种基于本体论的智能化网络信息检索模型
本文设计了一种基于本体论的智能化网络信息检索模型,其基本体系结构如图1所示。
图1 一种基于本体论的智能化网络信息检索模型
该模型主要由以下几个部分组成:用户界面代理、本体论服务器(包括用户偏好本体论库、任务本体论库和领域本体论库)、智能检索模块、文档分析器、个性化信息索引库以及智能搜索代理等。
2.1 用户界面代理
用户界面代理作为信息用户与智能检索模块之间的接口,除了具有接收用户提交的检索请求和智能检索模块返回的检索结果的功能外,它还具有提供用户对检索结果进行信息反馈以及对用户行为进行动态监测的功能。具体表现为:(1)建立用户个人档案。当用户首次登录时,用户界面代理要求用户通过注册建立起自己的个人档案,内容涉及用户身份、知识背景、兴趣领域等方面的内容。(2)对用户行为进行动态监测。对用户行为的动态监测可以包括:①计算用户对页面的浏览时间。②记录用户对页面特定部分的操作,如对某一部分的复制。③计算用户浏览页面距离现在的时间。(3)获取用户反馈信息。用户界面代理建立了用户对检索结果的评价机制,鼓励用户对检索结果给出量化的评价值,用于更新用户偏好本体论库中的内容。
2.2 任务本体论库
任务本体论库以机器可读的形式描述领域内任务专家的行为知识,阐明处理某一检索任务的策略、方法和过程,指导计算机自动实现检索任务目标的完成。当用户向系统发出检索请求时,智能检索模块根据相应的用户偏好本体论库和任务本体论库,指导检索过程沿着效果最优的方向进行检索。为了便于知识的共享和重用,任务本体论应该尽量
您可能关注的文档
最近下载
- 【《家庭养育环境评价探究的国内外文献综述3000字》】 .docx VIP
- 一(上)数学必考:100道看图列式+应用题.pdf VIP
- 贵州财经大学 汉语写作与百科知识A卷 2017年考研专业课真题.pdf VIP
- 【家庭养育环境评价探析的国内外文献综述3000字】.docx VIP
- 苏教版(2019) 选择性必修1 课时7 逻辑电路设计(选学) 课件.pptx VIP
- 【GB_T51455-2023】 城镇燃气输配工程施工及验收规范.docx VIP
- 新项目方法验证能力确认报告(固定污染源排放烟气黑度的测定 林格曼烟气黑度图法HJT 398-2007)展示版.pdf VIP
- 县级干部党校培训个人总结.docx VIP
- 《黑白装饰画课件》教学课件.pptx VIP
- 苏教版(2019) 选择性必修1 课时3 两种组合逻辑门——与非门、或非门 课件.pptx VIP
文档评论(0)