- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Ontology的个性化搜索引擎的研究.pdf
基于Ontology 的个性化搜索引擎的研究1
韩亮,李勇
大连海事大学计算机学院,辽宁大连(116026 )
E-mail :hanliang001@163.com
摘 要:随着信息技术的迅猛发展,网络成了人们获取信息的主要手段,网络给人们带来了
便利,但也带给人们困惑。信息浩如烟海,内容庞大,组织松散,要找到有用的信息,人们
经常要耗费大量时间,所以搜索引擎的性能问题成为人们搜索信息的重要保证。基于本体的
个性化搜索引擎的设计,摒弃了目前搜索引擎中普遍存在的问题。它借助用户的个人兴趣知
识,参照共享本体知识库对查询进行语义分析,对查询结果进行过滤,基本实现了个性化查
询。
关键词:本体,个性化,查询
中图分类号:TP311
1. 引言
随着信息技术的迅猛发展,网络成了人们获取信息的主要手段,网络给人们带来了便利,
但同时也带给人们困惑。信息浩如烟海,内容繁杂,组织松散,要找到有用的信息,人们经
常要耗费大量的宝贵时间,所以搜索引擎的性能问题成为人们搜索信息的重要保障。然而目
前的大部分搜索引擎的查询机制比较呆板,查询方式无针对性。查询的结果往往只有“广度”
而没有“深度” 。查全率和查准率这两个重要的指标难以保证。
合理的扩大查询范围,解决信息之间的语义异构,是保证查询指标的关键。使用 Ontology
来解释固有的、隐藏的知识是克服语义异构问题的一种方法[1] 。基于此,文章设计了基于本
体的个性化搜索引擎。它借助用户的个人兴趣知识,参照共享本体知识库对查询进行语义分
析,对查询结果进行过滤,基本实现了对相同的检索词不同用户得到不同的信息。
文章首先分析了目前个性化查询中存在的一些问题,阐述了本体技术的引入,重点介绍
了用户兴趣模型的建立,给出了搜索引擎的体系结构,最后做了展望。
2. 搜索引擎的研究现状
随着 Internet 的日益发展,人们可以轻松的找到需要的信息,免受了跑图书馆之苦。但
是网络信息数量巨大而且分散,人们无从下手。搜索引擎的代代更新,在一定程度上缓解了
这个问题,但是其自身的局限性,也为用户带来了很多不便。
目前的搜索引擎主要存在以下几个问题:
⑴语义性差,不能充分满足用户的个性化需求:当前的搜索引擎只是根据用户输入的仅有的
几个关键词,猜测用户要找什么,我们知道,这对于理解用户的需求和兴趣是远远不够的[2] 。
⑵查询精度不高:目前大多数的个性化搜索引擎在返回结果的精确度方面不够理想,因
此需要加强查询结果过滤等方面的研究。根据专家评测, 目前主要的搜索引擎返回的相关结
果的比率不足45 % ,而且由于机制、范围、算法等的不同,导致同样一个检索请求在不同搜
索引擎中的查询结果的重复率不足34 %[3] 。
⑶不能充分利用 Internet 上的半结构化信息。
⑷查询范围有限。
⑸对许多格式的文件不能处理:目前许多搜索引擎只能查找 HTML 格式,其他格式信
1本课题得到国家自然科学基金(项目编号)的资助。
- 1 -- 1 -
[4]
息包括 Word 文档、各种各样的电子邮件内容等无法查找 。
⑹对动态网页的处理能力弱:目前许多搜索引擎的查找对象仅限于可访问的页面,有些
用于生成动态页面的后台数据库内容无法访问。
针对以上问题,文章提出了一个比较可行的方法:建立基于本体的个性化搜索引擎,
将本体技术引入到个性化查询中。从根本上解决语义异构问题,扩大了查询的范围,提高了
查询的精度。
3. Ontology 技术的引入
本体(Ontology )是描述概念及概念之间关系的概念模型,通过概念之间的关系来描述
概念的语义。它是最先进的知识表示方式,能够描述所有的数据结构,是推理和关系数据库
系统的结合[2] 。Ontology 在信息系统中的应用,主要包括处理信息组织、信息检索和异构信
息系
您可能关注的文档
最近下载
- 2025年党员考试试题及答案.doc VIP
- 湖南公务员考试真题2024.docx VIP
- mPGES-2作为吸入全身麻醉药物异氟醚作用靶点的应用.pdf VIP
- 案例研究-案例研究:设计与方法.pdf VIP
- 2024届高考物理一轮复习热点题型归类训练专题13动力学和能量观点的综合应用(原卷版+解析).docx VIP
- 烟草质量检验竞赛通用知识题库-上(单选、多选题库).docx VIP
- 德育常规工作培训(1).pptx
- OMRON欧姆龙安全产品F3SG-SR PG系列安全光幕 多光束安全传感器F3SG-SR PG 系列 F3SG-□SR□系列安全光幕 用户手册.pdf
- 保险的培训资料1—开拓准客户.ppt VIP
- 上海建筑工程开工信息报送网上申请.pdf VIP
文档评论(0)