- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于本体概念的矢量检索模型研究.doc
基于本体概念的矢量检索模型研究
〔 )针对传统矢量空间模型文本特征值的 计算,给出将文本的评价由基于语法的词条空间转化 为概念空间的方法和策略:基于领域本体,依据本体 概念间的各种关联,先以一定的映射规则,将词条映 射到领域的概念术语空间;然后用概念统计和语义归 纳替代传统的词频统计,从概念语义的层次计算文本 的特征矢量。实验证明,基于本体概念的矢量检索模 型能够有效地表达文本的语义内容,获得更好的检索 效果。
〔关键词)本体概念检索矢量检索模型 〔分类号)TH18
Research on Vector Retrieval Model Based on Ontology Concept
NieHui
Department of Information Management, Sun Yat-sen University, Guangzhou510275
LongZhaohui
Lingnan College,Sun Yat-sen University,
Guangzhou510275
〔Abstract) For obtaining a documents feature value of vector space model, this paper pust forward an approach for evaluating documents feature value, which is not based on term space but concept space. This methodis supported by field ontology, and the words of document are firstly mapped to the ontology concept space according to the relationships of each other. Then, unlike normal statistical methods, the weight of term is carried out in terms of thematic conceptual vector retrieval model.Since document’s feature vector is constructed in the light of semantic content of Doc, the experiment results indicate that the performance of concept VSM is better than normal VSM.
〔Keywords) ontologyconceptual retrievalvector retrieval model
1引言
目前文本检索最常用的是基于关键词的矢量空间 模型,该模型利用出现在文本中的某些关键词语及表 征关键词重要性的权值构成矢量,表达文本与查询需 求的语义内容[1],并采用矢量内积计算文本特征矢量 与查询矢量间的相似度,以此给出中选文本的排序。 由于矢量空间模型在很大程度上依赖于其内容的特征 描述,又以词匹配策略为检索机制,因此往往存在某 些自身难以克服的问题,主要表现在:①矢量空间模型 以文本中出现的词形表达文本的语义内容,其相关性 判断只是词语的字面匹配。一词多义,一义多词等情 况难解决;②缺乏具有语义特征的规范词汇集,抽取 索引词的方法建立在语法基础上,索引关键词语表达 语义的能力有限,致使文本的特征矢量并不能有效地 代表文本的语义内容。另外,因为没有具有语义特征 的规范词集,检索请求的矢量描述随意且不精确,也 不能有效代表用户的信息需求[2]。这种检索模型的性 能自然不佳。
在检索机制中引入语义处理技术,是文本检索智 能化的重要途径。本文即针对矢量检索机制中的语义 处理展开研究。为了使构造的特征词矢量尽可能准确 地反映用户查询或文本原义,我们将文本及查询表示 为概念的矢量表达,化传统的矢量检索模型为基于语 义的概念矢量检索模型,不仅能解决一义多词和一词 多义等问题,而且经过语义处理的文本特征矢量与查 询矢量更准确地表达了其内容的原义,沿用矢量内积 的方法计算得到的相似度也更能体现文本间的语义关
联。另外,大量研宄表明,本体作为表达语义的基础 是合适的[2]。基于此,在本体支持下,我们构建领域 知识的概念空间,利用本体概念间的相等关系、同义 关系、上下位关系及其他相关性归纳融合文本词条, 重构本文及查询语句的特征描述,实现基于概念空间 的矢量检索模型。
文章的第2部分给出矢量检索模型的一般定义。 第3部分探讨在本体支持下的文本及查询的概念矢量 表达及概念权重的计算方法,给出概念矢量模
您可能关注的文档
最近下载
- 光伏电站的运行与维护规范.pdf
- 危化企业加油加气站双重预防机制手册.doc VIP
- 《首批重点监管的危险化学品名录》.pdf VIP
- 设计的创造性思维和工程思维 课件 高中通用技术粤科版 必修 技术与设计 .ppt VIP
- 兄弟 HL-4150CDN 4570CDW 4150 4570 彩色激光打印机中文维修手册.pdf VIP
- 医护人员职业安全与防护.pptx VIP
- 常用量具、检具测量基础知识试题(附答案).docx VIP
- 建设工程造价鉴定规范.pdf VIP
- 2025年中国石化校园招聘确认笔试参考题库附带答案详解.docx
- 现代家政学概论-ppt6.1第一节服装搭配.pptx VIP
文档评论(0)